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Słowo wstępne 


..... teoria gier i cybernetyka stanowią pod¬ 
stawę teorii tego. jak utorować Waszą Własną 
Drogę” 

W. Ross Ashby 


Obserwowany w ostatnich latach burzliwy 
rozwój cybernetyki jako nauki o sterowaniu w ogól¬ 
ności i związanym z nim przetwarzaniu informacji 
uwypukla znaczenie pewnych gałęzi matematyki 
współczesnej, przydatnych w procesie syntezy zło¬ 
żonych układów cybernetycznych. Wśród tych gałęzi 
matematyki na szczególne wyróżnienie zasługuje 
teoria gier. 

Zainteresowanie teorią gier dało się zauważyć już 
w latach II wojny światowej, jednak praktyczne 
jej wykorzystanie było wówczas raczej ograniczone 
i sprowadzało się do analizy gier o małej liczbie 
strategii. Dopiero pojawienie się elektronicznych 
maszyn cyfrowych pozwoliło na szersze praktyczne 
wykorzystanie teorii gier. Maszyna cyfrowa nie tyle 
stała się podstawowym narzędziem rozwiązywania 
gier o dużej liczbie strategii, ile raczej wskazywała 
na możliwość wykorzystania teorii gier jako aparatu 
formalnego, przydatnego do tworzenia modeli ma¬ 
tematycznych dla problemów wymagających roz¬ 
wiązania przy pomocy maszyny cyfrowej. 

Ukazanie się w 1948 r. książki Norberta Wienera 
Cybernetyka czyli sterowanie i komunikacja w zwie¬ 
rzęciu i maszynie, a w ślad za nią wielu innych publi- 
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kacji z zakresu cybernetyki, w szczególności książki 
Rossa Ashby’ego Wstęp do cybernetyki, zapocząt¬ 
kowało trwały związek teorii gier z cybernetyką. 
Okazało się mianowicie, że teoria gier jest bardzo 
często jedyną i niezastąpioną abstrakcją; matema¬ 
tyczną, przydatną w opisie formalnym pewnych 
zjawisk fizycznych i procesów sterowania, bardzo 
istotnych z punktu widzenia cybernetyki. 

Sposób zachowania się organizmu żywego w ob¬ 
liczu natury jest niczym innym, jak pewną grą dwu¬ 
osobową z naturą, grą — w której stosowane przez 
organizm strategie zostały wytyczone w wyniku 
wielowiekowych doświadczeń, nabytych w procesie 
obcowania danego gatunku z naturą. Znając do¬ 
kładnie zachowanie się danego organizmu we wszyst¬ 
kich możliwych okolicznościach, można każdej jego 
czynności przyporządkować określoną strategię po¬ 
stępowania, właściwą dla aktualnie powstałej sy¬ 
tuacji. Ponieważ na decyzje organizmu wywiera 
wpływ otoczenie, ogólnie — natura, zadanie upo¬ 
rządkowania tych strategii sprowadza się do sformuło¬ 
wania gry dwuosobowej z naturą. Dysponując ana¬ 
litycznym opisem tej gry można zbudować automąt, 
który — przeznaczony do rozgrywania modelowanej 
przez siebie gry — reprezentowałby zachowanie 
się organizmu. Na podstawie wyciągniętych wnios¬ 
ków z modelowania prostych organizmów można 
przystąpić do modelowania pewnych ograniczonych 
czynności mózgu ludzkiego. 

, To z kolei pozwala na budowę samodzielnych 
układów cybernetycznych — automatów rozgrywa¬ 
jących — które w wąskim zakresie przewyższałyby 
intelekt człowieka i mogłyby zostać wykorzystane 
do celowego oddziaływania na określone zjawiska 
fizyczne, a tym samym do optymalnego sterowania 
przebiegiem interesujących nas procesów. 
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Powstanie cybernetyki jest wynikiem wymagań 
współczesnej cywilizacji, a jej dalszy rozwój powo¬ 
duje, iż automaty rozgrywające będą nabierały 
coraz większego znaczenia, dlatego też wzrasta 
potrzeba poważniejszego zajęcia się teorią gier 
w sencie rozbudowy i uwypuklenia jej dużej przy¬ 
datności w cybernetyce. Z tych samych względów 
wynika konieczność popularyzacji teorii gier w as¬ 
pekcie jej wykorzystania do opisu procesów stero¬ 
wania, procesów decyzyjnych, zjawisk fizycznych 
i syntezy układów cybernetycznych. 

Potrzebę takiej popularyzacji uzasadnia prawie 
zupełny brak w Polsce literatury z tego zakresu, 
zarówno naukowej, jak i popularnonaukowej. Istnie¬ 
jące opracowania z teorii gier, zresztą bardzo nieliczne 
w języku polskim, dotyczą teorii gier najczęściej jako 
działu matematyki i abstrahują od jej praktycznego 
wykorzystania. Ponadto opracowania te są poświę¬ 
cone w zasadzie grom w postaci normalnej, chociaż 
wiadomo, że sprowadzenie jakiejkolwiek konkretnej 
gry, poza najprostszymi, do postaci normalnej jest 
zamierzeniem przerastającym ludzkie możliwości 
(por. rozdz. 2). 

Pierwotną postacią większości gier jest postać 
ekstensywna, wielochodowa, i w niej właśnie tkwi 
bogate źródło abstrakcji przydatnej do formalnego 
opisu procesów, wymagających sterowania przy 
pomocy automatów. Biorąc to pod uwagę, przyjąłem 
za cel książki scharakteryzowanie gier wielochodo- 
wych i sposobu ich wykorzystania w rozwiązywaniu 
problemów wchodzących w zakres cybernetyki. 
Jednakże, dla umożliwienia Czytelnikowi pełnego 
wglądu w teorię gier, w książce przedstawiono rów¬ 
nież krótką charakterystykę gier w postaci normalnej. 
Pomimo iż książka jest przeznaczona dla szerokiego 
grona odbiorców, interesujących się współczesną 
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nauką i techniką, autor ma skrytą nadzieję, że za¬ 
gadnienia w niej poruszone zainteresują również 
specjalistów z tych gałęzi wiedzy, których problemy, 
w ujęciu teorii gier, tu zostały zasygnalizowane. 

W zakończeniu niniejszego wstępu pragnę po¬ 
dziękować prof. drowi hab. Juliuszowi Lechowi 
Kulikowskiemu z Instytutu Cybernetyki Stosowanej 
PAN za życzliwe ustosunkowanie się do projektu 
książki, jak również prof. drowi inż. Jerzemu Bro- 
mirskiemu z Instytutu Cybernetyki Technicznej Poli¬ 
techniki Wrocławskiej za szereg cennych dyskusji 
i uwag, dotyczących przedstawionych w książce 
problemów. 
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Charakterystyka teorii gier 

Przedmiot teorii gier 

Teoria gier, jedna z gałęzi matematyki współ¬ 
czesnej, jest matematyczną teorią sytuacji kon¬ 
fliktowych. Celem tej teorii jest opracowanie wska¬ 
zówek dla racjonalnego działania każdej ze stron 
występujących w sytuacji konfliktowej. Sytuacje 
konfliktowe są to sytuacje, w których krzyżują się 
sprzeczne tendencje różnych stron, realizujących 
różne cele. Przebieg sytuacji konfliktowych zależy 
od decyzji, podejmowanych przez uczestników kon¬ 
fliktu, przy czym każdy z uczestników dąży do za¬ 
stosowania takiej decyzji, która przyczyni się do 
rozwoju sytuacji na jego korzyść. 

Sytuacja konfliktowa występuje w różnych dzie¬ 
dzinach życia zarówno w życiu pojedynczego czło¬ 
wieka, jak i w życiu społeczeństw, w egzystencji 
prostych żywych organizmów i w odwiecznym dąże¬ 
niu człowieka do rządzenia otaczającym go światem. 

Najbardziej zauważalnym, jednoznacznie zdefinio¬ 
wanym, a przez to klasycznym przykładem kon¬ 
fliktu jest konflikt wojskowy w warunkach walki 
zbrojnej. Konflikt ten, tak stary jak historia ludz¬ 
kości, sprowadza się do tego, że interesy militarne 
dwóch stron uczestniczących w procesie prowadzenia 
walki zbrojnej są całkowicie ze sobą sprzeczne 
i każda ze stron dąży do realizowania takich decyzji, 
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które według subiektywnych przesłanek umożliwią 
jej uzyskanie sukcesu w postaci zwycięstwa. Innym 
przykładem bardzo wyraźnych konfliktów są kon¬ 
flikty polityczne, społeczne i ekonomiczne. Nato¬ 
miast najbardziej trywialnym przykładem są kon¬ 
flikty wynikające z reguł prowadzenia .gier towarzy¬ 
skich, np. gry w szachy, warcaby, pokera itp. 

Wielka liczba sytuacji konfliktowych i potrzeba 
ich analizowania, w celu określenia optymalnej 
decyzji dla jednej ze stron, przyczyniły się do powsta¬ 
nia teorii przydatnej zarówno do formalnego opisu 
sytuacji konfliktowej, jak i do jej analizy. 

Ponieważ zwykła gra towarzyska jest przykładem 
sytuacji konfliktowej i zawiera wiele składników 
wspólnych wszystkim konfliktom, teorię tę od słowa 
„gra” nazwano teorią gier. Z tych samych 
względów w teorii gier wykorzystano terminologię 
występującą w opisie zwykłych gier. Stąd też strony 
uczestniczące w danej sytuacji konfliktowej przyjęto 
nazywać graczami, rezultat konfliktu — 
wygraną jednego z graczy lub w szcze¬ 
gólnym przypadku remisem, natomiast decyzje 
podejmowane przez uczestników konfliktu przyjęto 
określać mianem strategii. , •. 

Wiadomo jednak, że każda sytuacja konfliktowa, 
wzięta bezpośrednio z praktyki, jest dość złożpąa, 
a jej analiza — utrudniona istnieniem licznych 
czynników ubocznych. ’ 

Aby daną sytuację konfliktową można było po¬ 
traktować jako grę realizowaną przez strony uczestni¬ 
czące w konflikcie, należy uwolnić się od - drugo;- 
rzędnych ubocznych czynników, a tym samym 
określić reguły gry. Łączy się. to ze szczegółową 
analizą sytuacji konfliktowej, której wynikiem,jest 
uproszczony, sformalizowany model sytuacji . kon¬ 
fliktowej, zasługujący na miano gry. 
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W każdej grze będącej modelem matematycznym 
sytuacji konfliktowej uczestniczyć musi co najmniej 
dwóch graczy, przy czym każdy z graczy musi mieć 
co najmriiej dwie strategie. 

Grę z dwoma graczami nazywamy grą dwuosobową, 
natomiast gdy liczba graczy jest większa od dwóch, 
mamy do czynienia z grą wieloosobową. Gra prowa¬ 
dzona jest według ściśle określonych reguł; dla gry 
będącej modelem sytuacji konfliktowej reguły wy¬ 
nikają z praw rządzących daną Sytuacją konfliktową. 
W procesie realizacji gry zgodnie z zadanymi regu¬ 
łami dochodzi się do pewnych wyników końcowych 
gry. Wynik końcowy gry określa jednoznacznie tzw. 
wypłatę dla każdego z graczy, a więc jest pewną 
miarą realizacji celu przez danego gracza. 

Można zadać sobie pytanie: jakie korzyści uzysku¬ 
jemy z modelu matematycznego gry opisującej 
interesującą nas sytuację konfliktową? Otóż model 
ten przedstawia pewne zadanie, które należy roz¬ 
wiązać. Rozwiązując to zadanie, tzn. rozwiązując 
grę, określimy optymalne strategie. postępowania 
dla każdego z graczy, a tym samym optymalne de¬ 
cyzje postępowania dla stron uczestniczących w da¬ 
nej sytuacji konfliktowej. Wynika z tego olbrzymia 
korzyść, gdyż istnieją przesłanki wyznaczenia opty¬ 
malnych dróg postępowania w różnorodnych sytua¬ 
cjach konfliktowych. 

Podsumowując w tym punkcie nasze rozważania 
możemy stwierdzić, że przedmiotem teorii gier jest 
budowa i analiza modeli mających postać. gier 
i będących odbiciem określonych zjawisk konflikto¬ 
wych, występujących w obiektywnej rzeczywistości 
otaczającej współczesnego człowieka. 
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Trochę historii 

Pojęcie gry jest bardzo stare, niektórzy (Johan 
Huizinga) twierdzą, że gra jest starsza od kultury. 
Gry wynalezione przez człowieka i narzucone mu 
przez naturę były i są w dalszym ciągu obrazem 
pewnych fikcyjnych sytuacji konfliktowych. Prawdo¬ 
podobnie niektóre rodzaje gier, np. gra w szachy, 
zostały stworzone po to tylko, by w wyniku uczestni¬ 
czenia w nich można było opanować sztukę umie¬ 
jętnego zachowania się w złożonych sytuacjach 
konfliktowych. 

Brak metod umożliwiających wybór optymalnych 
decyzji w sytuacjach konfliktowych uzasadniał po¬ 
trzebę szkolenia umysłów poprzez rozwiązywanie 
fikcyjnych sytuacji konfliktowych. Szkolenie takie 
uwarunkowane było również tym, że od najdawniej¬ 
szych czasów stopień optymalności podejmowanych 
przez daną osobę decyzji w sytuacji konfliktowej był 
uzależniony od stopnia doświadczenia- tej osoby. 
Doświadczenie to ugruntowywano przez uczestnictwo 
w celowo stworzonych fikcyjnych sytuacjach kon¬ 
fliktowych, będących subiektywną kopią obiektywnej 
rzeczywistości. Przykładem tego są stosowane do 
dzisiaj we wszystkich armiach świata gry wojenne 
jako forma szkolenia dowódców i sztabów w po¬ 
dejmowaniu decyzji co do działań bojowych. 

Wiadomo jednak, że decyzje podejmowane wy¬ 
łącznie na podstawie doświadczenia są bardzo często 
dalekie od optymalnych, czego bogatym źródłem 
przykładów jest historia wojen. Dlatego też wraz 
z rozwojem nauki rosła coraz bardziej potrzeba 
określenia metod naukowej analizy sytuacji kon¬ 
fliktowych. 

Pierwsze naukowe podejście do gier jako do sytu¬ 
acji konfliktowych spotykamy w XVII w. w kores- 
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pondencji matematyków francuskich Pascala i Fer¬ 
mata oraz w pracach fizyka holenderskiego Huy- 
ghensa. Uczeni ci, zajmując się analizą konkretnych 
gier, nie byli jednak jeszcze w stanie zaproponować 
graczom żadnej recepty na wygraną. Przekonanie 
o bezużyteczności zastosowania metod matematycz¬ 
nych do sytuacji z życia codziennego zahamowało 
na długo rozwój teorii gier, której odrodzenie nastą¬ 
piło dopiero w pierwszej połowie XX w. Matematyka 
nagromadziła bowiem wtedy cały arsenał środków 
i metod badawczych, które można było wykorzystać 
do stworzenia aparatu formalnego tej teorii. 

Pierwsze poważniejsze koncepcje związane z teorią 
gier występują w pewnych pracach francuskiego 
matematyka E. Borela z 1921 r., jak również w póź¬ 
niejszych, zwłaszcza w pracy opublikowanej w 1927 r., 
w której Borel sformułował twierdzenie o „minimak- 
sie”, lecz nie udowodnił go. 

Polskiego czytelnika szczególnie zainteresować po¬ 
winien fakt, że pierwsza polska praca z teorii gier 
ukazała już się w 1925 r. Był nią artykuł polskiego 
matematyka H. Steinhausa pt. „Definicje potrzebne 
do teorii gier i pościgu”, opublikowany we Lwowie 
w „Myśli Akademickiej”. 

Jednakże za głównego twórcę teorii gier uważa się 
powszechnie wybitnego amerykańskiego matematyka, 
Johna von Neumanna*, który w swej publikacji 
z 1928 r. sprecyzował podstawowe pojęcia teorii 
gier i udowodnił fundamentalne twierdzenie tej 
teorii, tzw. twierdzenie o „minimaksie”. j 


* John von Neumann (1903—1957) — jeden z naj¬ 
większych matematyków XX w. Urodził się w Budapeszcie 
i w tamtejszym uniwersytecie mając 23 lata uzyskał stopień 
doktora nauk matematycznych. W 1927 r. został docentem 
uniwersytetu w Berlinie, a w 1929 r.— w Hamburgu* W 1930 r. 
wyjechał do Stanów Zjednoczonych, gdzie znalazł się w gronie 
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Wszystkie wymienione prace, łącznie z pracą 
von Neumanna z 1928 r., nie zwróciły na siebie 
niczyjej uwagi. Były to prace zbyt specjalistyczne, 
przeznaczone dla matematyków, a nie dla przed¬ 
stawicieli tych nauk, w których pojęcie konfliktu 
odgrywa ważną rolę. Dopiero ukazanie się w 1944 r. 
książki napisanej przez von Neumanna i amerykań¬ 
skiego ekonomistę Morgensterna wzbudziło wielkie 
zainteresowanie teorią gier. Książka ta, nosząca 
tytuł Theory of Games and Economic Behavior (Teoria 
gier i postępowania ekonomicznego), stała się po 
prostu klasycznym dziełem tej teorii, na którym 
opiera się większość współczesnych badań z zakresu 
teorii gier. Począwszy od 1944 r. na świecie ukazało 
się dużo publikacji poświęconych teorii gier, jednakże 
jeszcze zbyt mało, aby ją dostatecznie spopularyzować. 
Ten brak szerszej popularyzacji teorii gier niewątpli¬ 
wie jest przyczyną zbyt powolnego jej rozwoju. 
Bardzo często, wyłącznie wskutek niedostatecznej 
wiedzy, w praktycznych zastosowaniach odrzuca się 
idee teorii gier, mimo ich niezaprzeczalnie wielkiej 
przydatności do tych zastosowań. 


pracowników naukowych uniwersytetu w Princeton. W 1931 r. 
otrzyma! tytuł profesora. Od 1933 r. aż do końca swego życia 
był profesorem matematyki w zakładzie studiów podyplo¬ 
mowych uniwersytetu w Princeton, Od 1955 r. członek Komisji 
do Spraw Energii Atomowej Stanów Zjednoczonych. 

Wśród jego wielu osiągnięć naukowych na szczególną 
uwagę zasługują prace z zakresu mechaniki kwantowej, teorii 
automatów, projektowania maszyn matematycznych i z teorii 
gier. Przy wykorzystaniu koncepcji von Neumanna dotyczącej 
struktury logicznej maszyn matematycznych budowane, są 
współczesne komputery. Opracowany przez niego w 1945 r. 
projekt maszyny cyfrowej, nazwanej EDVAC, jest kamieniem 
węgielnym rozwoju współczesnej techniki i nauki, w których 
komputery odgrywają coraz w ażn iejszą rolę. 
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Pojęcia podstawowe i podział gier 

Gra jest modelem abstrakcyjnym pewnej sy¬ 
tuacji konfliktowej i jest prowadzona według ściśle 
określonych reguł. W ogólnym przypadku w grze 
może uczestniczyć kilku uczestników, których inte¬ 
resy są sprzeczne. Rozważania nasze zawęzimy do 
rozpatrywania głównie gier dwuosobowych, gdyż 
gra dwuosobowa jest najprostszym i najczęściej 
spotykanym modelem sytuacji konfliktowej. W celu 
naświetlenia podstawowych pojęć występujących 
w teorii gier przyjmiemy, że grę prowadzi dwóch 
graczy, których oznaczymy symbolami A i B. Gra 
ta jest pewnym przedsięwzięciem, składającym się 
z kilku poczynań graczy A i B, którzy realizując to 
przedsięwzięcie dążą do przeciwnych celów. Po¬ 
czynania graczy są określone regułami gry. Przez 
reguły gry rozumiemy zbiór umów, które określają 
sposób postępowania graczy, zakres wiadomości 
każdego z nich o postępowaniu przeciwnika, sposób 
określenia wyników gry itp. W ujęciu abstrakcyjnym 
gra jest niczym innym, jak zbiorem opisujących ją 
reguł. Zwykle istnieje kilka możliwych wariantów 
rozegrania danej gry. Każdy konkretny przykład 
rozegrania danej gry, według dopuszczonego regu¬ 
łami gry wariantu, nosi nazwę partii. 

Elementami składowymi gry są ruchy, gra jest 
po prostu ciągiem ruchów wykonywanych przez 
graczy w określonej kolejności. Ruch dotyczy pew¬ 
nego etapu w procesie realizacji gry. 

Na danym etapie gry każdy z graczy wybiera ze 
zbioru dopuszczalnych dla siebie działań tylko jedno 
działanie. To wybrane działanie nosi nazwę wyboru. 

Załóżmy, że w pewnej grze w karty gracz A, na 
którego przypada ruch, dysponuje talią składającą 
się z ośmiu kart; wówczas możemy powiedzieć, że 
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ruch gracza A obejmuje osiem możliwych wyborów. 
Wyjście przez gracza A konkretną kartą będzie wy¬ 
borem. Ruch kryje więc w sobie zbiór alternatyw, 
a wybór określa jedną tylko, wybraną w danym 
momencie konkretną alternatywę. Pojęcie „ruch” 
pozostaje w takim stosunku do pojęcia „wybór”, 
jak gra w stosunku do partii gry. Stąd też'mówimy, że 
gra jest ciągiem ruchów, a partia gry — ciągiem 
wyborów. 

Pojęciem nie mniej ważnym niż ruch i wybór jest 
w teorii gier pojęcie strategii. Strategią nazywa się 
zbiór reguł, jednoznacznie określających wybór dzia¬ 
łania danego gracza w każdym ruchu w zależności 
od sytuacji, jaka może powstać w procesie prowa¬ 
dzenia gry. Aby określić strategię dla danego gracza, 
należy rozpatrzyć wszystkie możliwe do powstania 
sytuacje w grze i każdej sytuacji, i to w każdym 
ruchu, przyporządkować odpowiedni wybór dzia¬ 
łania. Po wybraniu strategii gracz może już w grze 
nie uczestniczyć, lecz podać spis reguł postępowania, 
opisujących wybraną strategię, innej osobie, która 
go będzie reprezentowała w danej grze. W szczegól¬ 
nym przypadku gracza może zastąpić automat dzia¬ 
łający zgodnie z zadaną mu strategią. 

Zajmijmy się teraz pewną klasyfikacją gier, pozo¬ 
stawiając w mocy założenie, że interesują nas wy¬ 
łącznie gry dwuosobowe. Kryteria podziału gier są 
bardzo różnorodne, np. może być przeprowadzony 
podział gier ze względu na sposób określania wy¬ 
ników gry. 

W grze dwuosobowej wynik gry może oznaczać 
wygraną gracza A, wygraną gracza B lub remis. 
Zwykle wynik gry wyraża się ilościowo liczbami. 
Na przykład liczba ze znakiem „plus” może ozna¬ 
czać liczbę punktów wygranych przez gracza A, 
natomiast liczba ze znakiem „minus” może oznaczać 
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liczbę punktów przegranych przez gracza A, a wygra¬ 
nych przez gracza B. W takim ujęciu zero oznacza¬ 
łoby remis w grze. Gra, w której jeden gracz wygrywa 
to, co drugi przegrywa, nazywa się grą z sumą zerową, 
gdyż w grze tej suma wygranych obu stron równa jest 
zeru. W grze z sumą zerową interesy obu graczy są 
wyraźnie sprzeczne. 

Przeciwstawnym typem gry jest gra o sumie nie- 
zerowej, zwana często grą nieściśle konkurencyjną. 
W grze tej liczba punktów wygranych przez gracza A 
nie równa się liczbie punktów przegranych przez 
gracza B. W grze o sumie niezerowej istnieją różniące 
się kryteria oceny wyników gry dla poszczególnych 
graczy. 

Biorąc pod uwagę charakter i ilość informacji 
będących w dyspozycji graczy, a dotyczących procesu 
realizacji gry, gry dzielimy na gry z pełną informacją 
i gry z niepełną informacją. Gry z pełną informacją, 
nazywane również grami o kompletnej informacji, 
charakteryzują się tym, że każdy z graczy zna przy 
każdym ruchu sytuację powstałą w grze oraz wyniki 
wszystkich poprzednich ruchów zarówno własnych, 
jak i swego przeciwnika. Przykładem gier z pełną 
informacją są szachy, warcaby, gra w kółko i krzyżyk. 
Większość gier mających praktyczne znaczenie na¬ 
leży do gier z niepełną informacją. Brak pełnej in¬ 
formacji w grze. może się objawiać różnorodnie, 
np. gracz A wykonując ruch nie zna poprzedzającego 
ten ruch wyboru gracza B, a tym samym nie zna 
sytuacji powstałej w grze. Przykładem gier z niepełną 
informacją są gra w domino, gry w karty oraz gry 
wojenne opisujące sytuacje bojowe na polu walki. 

W zależności od liczby możliwych strategii, gry 
dzielą się na skończone i nieskończone. Grą skoń¬ 
czoną nazywamy grę, w której każdy gracz ma tylko 
skończoną liczbę strategii. Natomiast gra nieskoń- 
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czona jest to taka gra, w której co najmniej jedna 
ze stron ma nieskończenie wiele strategii. 

Gry dwuosobowe, z punktu widzenia jednego 
z graczy uwzględniającego osobowość gracza drugiego, 
możemy podzielić na gry z rozumnym przeciwnikiem 
i gry z naturą. Gry z naturą charakteryzują się tym, 
że natura jako druga strona gry nie jest zaintereso¬ 
wana końcowym wynikiem gry, a wykonywane przez 
nią ruchy mają charakter losowy. 

Pojęcie gry z naturą, często nazywanej grą przeciw 
naturze, jest bardzo pomocne przy formowaniu 
modeli matematycznych opisujących procesy stero¬ 
wania, a więc gra ta zajmuje szczególną pozycję 
w cybernetyce. 

Że względu na charakter prowadzenia gier oraz 
postać opisującego je modelu matematycznego, 
gry dzielimy na gry w postaci normalnej i gry w po¬ 
staci ekstensywnej, występujące bardzo często pod 
nazwą gier wielochodowych.' Podział ten jest chyba 
najistotniejszym podziałem w teorii gier, gdyż uwy¬ 
pukla w niej dwa podstawowe i różniące się między 
sobą sposoby podejścia do pojęcia gry i jej przed¬ 
stawienia. Gra w postaci normalnej reprezentuje 
pewien proces statyczny, jednorazowy i niezmienny 
w czasie, natomiast gra w postaci ekstensywnej 
reprezentuje pewien proces dynamiczny, a więc 
zmieniający się w czasie. W grze w postaci normalnej 
każdy z graczy dysponuje zbiorem przyporządko¬ 
wanych mu strategii. Realizacja gry w postaci nor¬ 
malnej sprowadza się do tego, że. obaj gracze do¬ 
konują jednocześnie. wyboru po jednej ze swoich 
strategii, przy czym żaden z graczy nie zna wyboru 
strategii swego przeciwnika. Wybór strategii przez 
graczy jest jednocześnie początkiem i końcem danej 
partii gry i jednoznacznie określa jej wynik. Postać 
normalna konkretnej gry jest uogólnionym modelem 
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tej gry, umożliwiającym jej analizę celem określenia 
optymalnych strategii graczy, natomiast nie wnika 
w proces prowadzenia gry. 

W odróżnieniu od gry w postaci normalnej, będącej 
procesem jednoetapowym, gra w postaci ekstensyw¬ 
nej jest wieloetapowym procesem prowadzenia gry, 
a więc reprezentuje grę wielochodową. 

Gra wielochodową przebiega w funkcji czasu 
i jest ciągiem ruchów wykonywanych przez graczy 
w określonej kolejności — na przemian i nie jedno¬ 
cześnie (np. gra w szachy). W grze wielochodowej 
podstawowym elementem procesu realizacji gry jest 
ruch i dokonywany w nim wybór, natomiast w grze 
przedstawionej w postaci normalnej zasadniczą rolę 
odgrywa wybór strategii. 

Gry w postaci normalnej i gry w postaci eksten¬ 
sywnej omówione zostaną szerzej w następnych 
rozdziałach niniejszej książki. 




Gry w postaci normalnej 


Model matematyczny gry dwuosobowej 

Główną i podstawową rolę w teorii gier speł¬ 
niają gry dwuosobowe, gdyż większość sytuacji 
konfliktowych można sprowadzić do konfliktu dwóch 
stron. Spośród wymienionych we wstępie rodzajów 
gier dwuosobowych, najprostszym i jednocześnie 
najdokładniej opracowanym modelem gry dwuoso¬ 
bowej jest gra dwuosobowa o sumie zerowej. 

A oto krótka charakterystyka tej gry. Z grą dwu¬ 
osobową o sumie zerowej mamy do czynienia wtedy, 
gdy w sytuacji konfliktowej opisanej modelem gry 
występują dwie strony, przy czym interesy stron są 
przeciwstawne, a wygrana jednej ze stron równa się 
przegranej drugiej. Strony gry nazywać będziemy 
po prostu graczami. Najwygodniejszym do analizy 
modelem matematycznym tej gry jest jej postać 
normalna. Zgodnie ż definicją postaci normalnej gry, 
w procesie realizacji takiej gry każdy z graczy wy¬ 
biera jedną z możliwych dla siebie strategii, przy 
czym wybór ten gracze przeprowadzają równocześnie. 
Przez określenie dla obu graczy A i B wszystkich 
możliwych dla nich strategii uzyskamy dwa zbiory: 
zbiór strategii gracza A i zbiór strategii gracza B. 
Zbiory te oznaczymy następująco 
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dla gracza A 




*•*3 




dla gracza B 
Z 


{Zi, Z- 



Element Y t zbioru Y jest i-tą strategią gracza A, 
zaś element Zj zbioru Z jest j -tą strategią gracza B. 
W ogólnym przypadku liczba strategii gracza A 
może się znacznie różnić od liczby stratę gii gracza B, 
stąd też m / «. Pojedyncze strategie zbioru Y i Z 
będziemy umownie nazywać strategiami czystymi, 
w odróżnieniu od tzw. strategii mieszanych, które 
zdefiniowane zostaną później. Każdej parze strategii 
czystych, wybranych przez graczy, odpowiada okreś¬ 
lony wynik gry. Na przykład, gdy gracz A wybrał 
strategię Y h a gracz B wybrał strategię Z } , to jedno¬ 
znacznie zostanie określony wynik gry, oznaczony 
umownie symbolem a tJ . Wynik ten, nazywany bardzo 
często wypłatą, może mieć wiele interpretacji. Może 
mianowicie wskazywać, ile jednostek pieniężnych 
gracz B płaci graczowi A (lub odwrotnie), może 
wskazywać na prawdopodobieństwo realizacji pew¬ 
nego przedsięwzięcia przez któregoś z graczy lub po 
prostu może tylko wskazywać na umowną wielkość 
wygranej (lub przegranej) przez danego gracza. 
Zwykle wynik gry określa się z punktu widzenia 
interesów jednego z graczy, np. gracza A, więc liczba 
dodatnia wskazywać może na stopień wygranej 
gracza A, a liczba ujemna na stopień wygranej gra¬ 
cza B. Stąd też wypłata a u = 5 będzie oznaczała, 
że gracz A wygrywa 5 umownych jednostek, zaś 
gracz B przegrywa 5 jednostek; odwrotna sytuacja 
powstanie wówczas, gdy a u = — 5. 

Wartość wypłaty zależy od wybranych przez graczy 
strategii. Aby ułatwić sobie analizę gry, wyniki gry 
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zestawiamy w specjalnej tablicy prostokątnej, umow¬ 
nie nazwanej macierzą gry lub macierzą wypłat. 

W ogólnym ujęciu pod terminem „macierz” 
rozumie się zbiór liczb zapisanych w postaci prosto¬ 
kątnej tablicy o m wierszach i n kolumnach. Tablicę 
oznaczającą macierz ujmuje się w nawiasy kwadra¬ 
towe tak, jak to przedstawiono poniżej 

a ll a \2 ••• a l) ••• a ln 
a 2l a 22 ••• a 2j a 2n 


a tl a l2 ••• a ij ••• a tn 


|_ ^mi &m2 •** &mj **■ &mn __] 

Liczby a u umieszczone w macierzy nazywamy ele¬ 
mentami macierzy, przy czym pierwszy wskaźnik 
elementu au oznacza numer wiersza, drugi — numer 
kolumny. Symbol a u umownie nazywa się elementem 
ogólnym macierzy, gdyż w zależności od wartości 
wskaźników i, j określa on ten lub inny element 
macierzy. Gdy macierz składa się z m wierszy i n 
kolumn, wówczas mówi się, że jest to macierz wy¬ 
miaru m x n lub typu mxn, przy czym gdy m # n, 
to macierz jest prostokątna, natomiast dla m — n 
macierz jest kwadratowa. Macierz gry różni się tym 
od macierzy przedstawionej w ujęciu ogólnym, 
że jej wiersze i kolumny oznacza się dodatkowo sym¬ 
bolami, będącymi nazwami strategii graczy. 

Macierz gry możemy przedstawić symbolicznie 
w następujący sposób 
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Wiersze macierzy gry są opisane strategiami gracza A, 
a kolumny — strategiami gracza B. Dowolny współ¬ 
czynnik a u zapisany w klatce powstałej z przecięcia 
i-tego wiersza i /-tej kolumny wskazuje na wielkość 
wypłaty, jaką uzyska gracz A w przypadku, gdy za¬ 
stosuje strategię Y t , a gracz B — strategię Zj. Gra 
wyrażona przy pomocy macierzy gry, w której znaj¬ 
duje się m wierszy i n kolumn, nazywa się grą typu 
mxn. Gra taka jest grą skończoną, gdyż każdy 
z graczy ma skończoną liczbę strategii. Dla ilustracji 
sposobu zapisu gry w postaci macierzy rozpatrzymy 
prosty przykład gry. 

Przykład 1 

Dwaj gracze A i B równocześnie i niezależnie od 
siebie zapisują każdy jedną z trzech liczb: 1, 2 lub 3. 
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Jeżeli suma napisanych liczb jest parzysta, to gracz B 
płaci graczowi A tę sumę w złotówkach, jeśli suma 
jest nieparzysta, to na odwrót, gracz A płaci ją gra¬ 
czowi B. 

Powyższą grę należy przeanalizować i utworzyć 
macierz gry. Ze słownego opisu gry wynika, że każdy 
z graczy ma trzy strategie. Dla gracza A strategie te 
przedstawiają się następująco: 

Fi — napisać 1 , Y 2 — napisać 2, Y 3 — napisać 3. 

Podobnie dla gracza B mamy strategie: 

Z x — napisać 1, Z 2 — napisać 2, Z 3 — napisać 3. 

Gra jest grą typu 3 x 3, a jej macierz przedstawia się 
następująco 


B 

A 

Z x 

Z 2 



2 

-3 

4 

y 2 

-3 

4 

-5 

y 3 

4 

-5 

6 





Rozpatrzmy tę grę z punktu widzenia gracza A. 
Gdyby gracz A wiedział, jaką strategię czystą za¬ 
stosuje gracz B, nie miałby żadnych trudności ze 
znalezieniem swojej najlepszej strategii czystej. Je¬ 
żeli np. wyborem gracza B byłaby strategia Z l5 to 
gracz A zastosowałby strategię Y z , gdyż wówczas 
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wygrywa 4 złote, stosując natomiast strategię Y t 
gracz A wygrałby tylko 2 złote, a stosując strategię Y 2 
przegrałby 3 złote. 

Korzystając z macierzy gry można określić w ana¬ 
logiczny sposób najlepsze strategie gracza A dla 
pozostałych dwóch strategii gracza B, tj. strategii Z 2 
i Z 3 , oczywiście przy założeniu, że gracz A jest wcześ¬ 
niej poinformowany o wyborze gracza B. Ponieważ 
jednak obaj gracze dokonują wyboru jednocześnie 
i gracz A nie jest informowany o zamiarze swego 
przeciwnika, określenie optymalnego postępowania 
gracza A w grze jest zadaniem niełatwym. 

W podobny sposób możemy przeanalizować grę 
z punktu widzenia gracza B, dochodząc do tego 
samego wniosku, że określenie optymalnego postę¬ 
powania gracza B jest również zadaniem niełatwym. 
Zadanie to jest rozwiązywalne, jednakże aby je roz¬ 
wiązać, musimy znać dostatecznie dobrze teorię 
gier. 

Podana w przykładzie gra przedstawia pewną 
sytuację konfliktową, a wiemy, iż celem teorii gier 
jest nic innego, jak „ tylko opracowanie wskazówek 
dotyczących rozumnego zachowania się graczy wsy- 
tuacjach konfliktowych. Rozumne postępowanie gra¬ 
czy oznacza, że graczom nie wolno ryzykować. Teoria 
gier nie uznaje ryzyka, przy czym analizując daną 
grę z punktu widzenia jednego z graczy zawsze 
zakłada się, że przeciwnik jest nie mniej rozumny 
i będzie robił wszystko, aby uzyskać jak największą 
wygraną dla siebie. Określenie dla każdego z graczy 
optymalnego, rozumnego postępowania w danej 
grze sprowadza się do wyznaczenia każdemu z nich 
strategii optymalnej. Strategią optymalną 
gracza nazywa się taką strategię, która przy wielo¬ 
krotnym powtarzaniu gry zapewnia danemu gra- 
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czowi możliwie maksymalną średnią wygraną. Opty¬ 
malne strategie graczy można określić na podstawie 
wyników analizy macierzy gry. ? 

Dla przykładu rozpatrzmy bardzo prostą macierz 

gry 


B 

A 

Zi 

Z 2 

Y x 

, -2 

1 

y 2 

1 

2 


Ponieważ zgodnie z przyjętym założeniem zawarte 
w macierzy gry wypłaty dotyczą tylko jednego gracza, 
a mianowicie gracza A, można przyjąć, że gracz A 
będzie starał się wybrać taką strategię ze zbioru 
{y,, Y 2 }, która mu zapewni maksymalną wygraną,, 
natomiast gracz B będzie starał się wybrać taką 
strategię ze zbioru {Z t , Z 2 }, aby wygrana gracza A 
była minimalna. W tym też celu obaj gracze prze¬ 
prowadzą analizę macierzy 5 gry, rozpatrując kolejno 
swoje strategie. Gracz A rozpatrując swoją strategię Y x 
musi się liczyć z tym, że jego przeciwnik może za¬ 
stosować strategię najmniej korzystną dla gracza A, 
a mianowicie strategię Z v Zgodnie z takim rozumo¬ 
waniem strategia F, przedstawia dla gracza A wartość 
— 2, przy czym wartość ta wskazuje na tzw. poziom 
bezpieczeństwa przy wyborze przez gracza A stra¬ 
tegii Y x . < • 

Przystępując do badania strategii Y 2 , gracz A 
łatwo stwierdzi, że stosując tę strategię będzie miał 
zapewnioną wygraną równą 1. Strategia Y 2 maksy- 
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mąlizuje więc poziom bezpieczeństwa gracza A, 
gdyż zapewnia mu wygraną co najmniej równą 1, 
natomiast strategia Y x nie zapewnia mu takiej wy¬ 
granej. Ponieważ w rozpatrywanej grze wielkość 1 
jest największą wygraną, jaką może sobie zagwaran¬ 
tować gracz A, wielkość tę nazwiemy dolną war¬ 
tością gry. Dolną wartość gry oznaczać bę¬ 
dziemy symbolem a, w naszym przypadku a = 1 = 
= d 1X . 

Analizując z kolei przedstawioną macierz z punktu 
widzenia gracza B stwierdzimy, że dla strategii Z x 
poziom bezpieczeństwa wynosi 1, zaś dla strategii Z 2 
wynosi on 2. Strategia Z x maksymalizuje więc po¬ 
ziom bezpieczeństwa gracza B , gdyż stosując strate¬ 
gię Z x gracz B może przegrać co najwyżej 1. Wielkość 
1 jest w tym przypadku górną wart ością 
gry, oznaczywszy ją symbolem (3 możemy zapisać 
P = 1 *— a 21 . Z przeprowadzonej analizy wynika 
więc, że a = P = 1 = a 2l . 

Gdy dolna i górna wartość gry są sobie równe, 
można bardzo łatwo wyznaczyć optymalne strategie 
czyste graczy. Są nimi te strategie, które maksyma¬ 
lizują poziomy bezpieczeństwa graczy. Stąd też dla 
rozpatrywanej macierzy gry optymalną strategią 
czystą gracza A jest 72, a gracza B —strategia 
'Z/1 . - 

Zwykle w celu określenia dolnej i górnej wartości 
gry posługujemy się metodą bardziej sformalizo¬ 
waną, niż to wynika z przeprowadzonej wyżej analizy. 
Dla scharakteryzowania tej metody posłużymy się 
macierzą gry w postaci ogólnej, z tym że macierz 
tę .uzupełnimy, o dodatkową kolumnę oznaczoną 
symbolem a*, i dodatkowy wiersz oznaczony sym¬ 
bolem P*. 

fyfacierz ta przedstawia się następująco 
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W celu określenia dolnej wartości gry z każdego 
wiersza macierzy wybieramy element o najmniejszej 
wartości i zapisujemy go z prawej strony danego 
wiersza w kolumnie a*. Wybrany z i-tego wiersza 
element o najmniejszej wartości oznaczamy symbo¬ 
lem a,, a sam proces wyboru zapiszemy symbolicznie 
następująco 

dj = min a tJ 
j 

Zapis m j n (minimum po j) rozumiemy w ten sposób, 

że dla i = const oraz j = 1, 2, n wybieramy ele¬ 
ment a u o najmniejszej wartości. Z kolei po zapełnie¬ 
niu kolumny a* wybieramy spośród wszystkich 
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elementów^ element o wartości największej, który jest 
dolną granicą gry. Wybór ten zapiszemy następująco 

a = max a* 

i 

Po wyznaczeniu dolnej wartości gry przystępujemy 
do określenia górnej wartości gry. W tym celu z każdej 
kolumny wybieramy element o największej wartości 
i zapisujemy go u dołu danej kolumny w wierszu {3*. 
Dla y-tej kolumny element o największej wartości 
oznaczymy symbolem p j5 a sam proces wyboru za¬ 
piszemy następująco 

p; = max a tJ 

i 

tzn. przyjmując j = const i zmieniając kolejno 
numery wierszy od i = 1 do i = m wybieramy 
element a u o największej wartości. Z kolei po za¬ 
pełnieniu wiersza p* wybieramy spośród wszystkich 
wielkości p y (dla j = 1, 2, ..., n) element o najmniej¬ 
szej wartości, będący górną wartością gry. Wybór 
ten zapisujemy symbolicznie jako 

P = min Pj 

j 

Dla przykładu wyznaczmy dolną i górną wartość gry 
dla macierzy przedstawionej poniżej 
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Dla macierzy tej dolna i górna wartość gry są sobie 
równe i wynoszą a = 1 i p — 1. Jeśli dolna wartość 
gry równa się górnej, to ich wspólną wartość będziemy 
nazywać wartością gry i oznaczać sym¬ 
bolem v. Ponieważ dla rozpatrywanej macierzy gry 
spełniona jest równość a = v = p, rozwiązanie gry 
jest bardzo proste. Wiersz macierzy, któremu przy¬ 
porządkowana jest dolna wartość gry, określa opty¬ 
malną strategię czystą gracza A — strategią tą jest Pj. 
Podobnie kolumna, której przyporządkowana jest 
górna wartość gry, określa optymalną strategię 
czystą gracza B — strategią tą jest Z 2 . 

W większości przypadków dolna i górna wartość 
gry nie są sobie równe. Na przykład określając dolną 
i górną wartość gry dla macierzy z przykładu 1 
stwierdzimy, że a = —3 oraz P = 4. W związku 
z tym, że a # P, gry takiej nie możemy rozwiązać 
przez określenie optymalnych strategii czystych graczy, 
lecz przez określenie optymalnych stra¬ 
tegii mieszanych, które zdefiniujemy trochę 
dalej. 


Gry zamknięte 

W zależności od tego czy dolna wartość gry 
równa się górnej wartości, czy też wielkości te nie są 
sobie równe, dwuosobowe gry o sumie zerowej 
możemy podzielić na gry zamknięte i gry otwarte. 
Z grą zamkniętą mamy do czynienia wtedy, gdy 
zachodzi równość a = v = p. Natomiast w przy¬ 
padku, gdy dla danej gry spełniona jest nierówność 
a P, grę taką nazwiemy grą otwartą. Najpierw 
rozpatrzymy gry zamknięte. Gry zamknięte wystę¬ 
pują często pod nazwą gier zawierających pary stra¬ 
tegii w równowadze, przy czym każda taka gra charak- 
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teryzuje się tym, że w jej macierzy można wyróżnić 
tzw. punkt siodłowy. Punkt siodłowy jest takim 
elementem a u macierzy gry, który, będąc najmniej¬ 
szym w danym wierszu i jednocześnie największym 
w danej kolumnie, określa sobą wartość gry v oraz 
dolną i górną wartość gry. W punkcie siodłowym 
przecinają się optymalne strategie czyste graczy, 
co łatwo stwierdzić wracając do przykładów omó¬ 
wionych w poprzednim punkcie. 

Rozpatrzmy teraz bardziej konkretny przykład gry 
zamkniętej, który posłuży nam do przedstawienia 
właściwości tego typu gry. 

Przykład 2 

Wojska czerwonych i niebieskich znajdują się 
w konflikcie zbrojnym. Wojska niebieskich, będące 
stroną B gry, przystępując do jednej z kolejnych 
operacji bojowych planują wykonać uderzenie na 
obronę wojsk czerwonych w jednym z czterech 
możliwych kierunków Z l5 Z 2 , Z 3 , Z*. Wojska czer¬ 
wonych, będące stroną A gry, licząc się z uderzeniem 
nieprzyjaciela na broniony przez siebie rejon, po¬ 
stanowiły tak rozmieścić swoje środki ogniowe, 
by zadać nieprzyjacielowi maksymalne straty bez 
względu na to, z jakiego on będzie nacierał kierunku. 
W tym też celu dowództwo bronionego rejonu 
opracowało cztery możliwe warianty rozmieszczenia 
środków ogniowych Y u Y 2 , F 3 , Y A oraz przyjęło, 
że stopień obezwładnienia nacierającej strony B 
zależy od przyjętego przez nią kierunku natarcia 
i od przyjętego wariantu rozmieszczenia środków 
ogniowych obrony. Z opisu powyższej sytuacji b 
jowej wynika, że przedsięwzięcia strony A i ' 
źródłem konfliktu, w którym strona B dąży dr 
jęcia takiego kierunku natarcia, by mieć 
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mniejsze straty, a strona A zainteresowana jest 
w przyjęciu takiego wariantu działania, by zadać 
nacierającemu jak największe straty. Matematyczny 
model tego konfliktu można opisać macierzą gry, 
której elementy a u , określane przez stronę A, przed¬ 
stawiają stopień obezwładnienia nacierającego prze¬ 
ciwnika B. Macierz tej gry przedstawia się następu¬ 
jąco 
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Określając na podstawie tej macierzy dolną i górną 
wartość gry łatwo jest stwierdzić, że a = 0,7 oraz p = 
= 0,7 umownych jednostek. Ponieważ dolna i górna 
wartość gry są sobie równe, rozpatrywana gra ma 
punkt siodłowy. Tym punktem siodłowym jest element 
macierzy a 32 = 0,7, leżący na przecięciu wiersza Y 3 
i kolumny Z 2 . Punkt siodłowy jednoznacznie określa 
optymalną strategię czystą strony A i B. Stąd też 
strategia T 3 jest optymalną strategią czystą strony A, 
natomiast strategia Z 2 jest optymalną strategią 
czystą strony B. 
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Z analizy wartości elementów w kolumnie Z 2 
i wierszu Y 3 przedstawionej macierzy gry wynika, 
że jakiekolwiek odstępstwo nacierającego od jego 
optymalnej strategii Z 2 , przy nie zmienionej strategii 
optymalnej strony A, przynosi mu większe straty. 
Podobnie odstępstwo strony A od optymalnej strate- 
tegii Y 3 , przy nie zmienionej strategii strony B, 
zmniejsza straty nacierającego. Jeśli natomiast obie 
strony zastosują swoje optymalne strategie czyste, to 
wygrana strony A jest równa wartości gry v = 0,7, 
tzn. stopień obezwładnienia strony B będzie wynosił 
0,7 umownych jednostek. 

W dowolnej dwuosobowej grze zamkniętej opty¬ 
malną strategię czystą gracza A nazywamy stra¬ 
tegią maksyminimalną, natomiast opty¬ 
malną strategię czystą gracza B nazywamy strate¬ 
gią minimaksymalną. Jeśli w grze zamknię¬ 
tej gracz A stosuje strategię maksyminimalną, to przy 
jakimkolwiek poczynaniu swego przeciwnika ma 
zagwarantowaną wygraną nie mniejszą niż dolna 
wartość gry a. Podobnie jeżeli w grze zamkniętej 
gracz B stosuje Strategię minimaksymalną, to przy 
jakimkolwiek poczynaniu gracza A nie przegrywa 
on więcej niż wynosi górna wartość gry P, ewentu¬ 
alnie nie wygrywa mniej niż p. Rozwiązanie gry 
zamkniętej jest bardzo proste, gdyż sprowadza się 
do określenia wartości gry a = v = p oraz do okreś¬ 
lenia strategii maksyminimalnej dla gracza A i stra¬ 
tegii minimaksymalnej dla gracza B. 

Gry otwarte 

W praktyce bardzo rzadko spotykamy się 
z grami zamkniętymi, które z teoretycznego punktu 
widzenia są mało ciekawe, gdyż ich rozwiązanie jest 
trywialne. 


3* 
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Można powiedzieć, że gry zamknięte są szczegól¬ 
nym przypadkiem gier dwuosobowych o sumie 
zerowej. Najczęściej mamy do czynienia z grami 
otwartymi, tzn. z takimi dwuosobowymi grami 
o sumie zerowej, które nie mają punktu siodłowego 
w obszarze strategii czystych. W grze* otwartej dolna 
wartość gry a nie równa się górnej wartości gry p, 
a więc istnieje nierówność a ^ P oraz spełniona jest 
relacja a v < p. 

Dla przykładu rozpatrzmy następującą macierz gry: 
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Dla macierzy tej dolna wartość gry wynosi 2, a górna 
wartość gry wynosi 3. Gra opisana taką macierzą 
jest grą otwartą, gdyż o ^ P, a więc brak w niej 
punktu siodłowego. Różnicę P-a nazywamy zwykle 
rozwartością gry otwartej. W rozwartości gry ot¬ 
wartej kryją się dodatkowe szanse podwyższenia 
wygranej dla każdego z graczy. 

Analizując naszą macierz gry zwróćmy uwagę, że 
gracz A stosując swoją maksyminimalną strategię Y 2 
gwarantuje sobie przy dowolnym postępowaniu swego 
przeciwnika wygraną równą co najmniej dolnej war¬ 
tości gry a = 2. Podobnie gracz B stosując swoją 
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minimaksymalną strategię Z x nie będzie przegrywał 
więcej niż wynosi górna wartość gry p= 3. Jeśli 
w grze gracz A uparcie będzie powtarzał swoją 
strategię T 2 , to gracz B natychmiast się zorientuje, 
że stosując swoją strategię popełnia błąd, gdyż 
w każdej partii przegrywa 3 punkty, natomiast 
stosując Z 2 przegrywałby tylko 2 punkty. Po dojściu 
do takiego wniosku gracz B zacznie stosować w grze 
swoją strategię czystą Z 2 . Jednakże co najmniej po 
dwóch partiach gracz A zorientuje się o zmianie 
dokonanej w postępowaniu gracza B i stwierdzi, 
że dotychczas stosowana przez niego strategia Y 2 
przynosi mu wygraną tylko 2 punkty, natomiast 
stosując strategię Y x mógłby w każdej partii wygry¬ 
wać aż 4 punkty. Z kolei więc gracz A zmieni swoją 
strategię czystą Y 2 na strategię czystą Y,. Dalej 
proces przebiegać będzie analogicznie. 

Z powyższego więc wynika, że gracze w trakcie 
realizacji gry będą zmieniać swoje strategie czyste 
w celu uzyskania większej wygranej. Gracz A będzie 
dążył do uzyskania średniej wygranej większej niż a, 
natomiast gracz B będzie dążył do obniżenia średniej 
przegranej poniżej wartości p. 

W ogólnym przypadku dla dowolnej gry otwartej, 
każdy z graczy chcąc podwyższyć swoją wygraną 
powinien stosować nie jedną strategię czystą, lecz 
pewną strategię kombinowaną, złożoną z kilku 
strategii czystych stosowanych w grze z odpowied¬ 
nimi częstościami i to w sposób losowy. Taką stra¬ 
tegię kombinowaną, polegającą na stosowaniu kilku 
czystych strategii zmieszanych w sposób losowy 
z określonymi częstościami, przyjęto nazywać stra¬ 
tegią mieszaną. Dla oznaczenia strategii 
mieszanych graczy jest wprowadzona specjalna sym¬ 
bolika. Mianowicie, jeśli strategia mieszana gracza A 
będzie polegała na stosowaniu przez niego strategii 
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czystych Y u Y 2 , ... Y m z częstościami odpowiednio 
x u x 2 > ... przy czym 


X\ ~i~X 2 + 


t # * 


-4- v 
i 


l 


to strategię tę można oznaczyć następująco 


X = 







Podobnie można oznaczyć strategię mieszaną gracza B 
jako 

Z rjr 

2 5 ... j /b|| 

^1» -S 25 ••• > Ąi 



przy założeniu, że gracz B zastosuje w grze strategie 
Z x , Z 2 ..., Z„ z częstościami j l9 j 2 , ..., j n . W praktyce 
posługujemy się zapisem uproszczonym w postaci 

X (*^i, x 2 , ..., ..., Xff]) 

oraz 

5 ~ (*ri, ••• » ••• » n) 


Rozwiązanie gry otwartej sprowadza się do wyzna¬ 
czenia optymalnych strategii mieszanych graczy, 
tzn. takich strategii X* i S*, przy których zastoso¬ 
waniu wygrane obu graczy są sobie równe i okreś¬ 
lają tzw. minimaksową wartość gry v. Minimaksowa 
wartość gry jest zawarta zawsze między dolną i górną 
wartością gry i określana nierównością 

a v p 

Wybór optymalnych strategii mieszanych graczy 
sprowadza się do określenia optymalnych częstości 
x t i Sj dla poszczególnych strategii mieszanych. 
Zadanie to jest na ogół złożone, przy czym złożoność 
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ta zależy od rozmiarów macierzy gry. Najprostsze sto¬ 
sunkowo rozwiązanie ma gra typu 2x2, co zilustru¬ 
jemy na przykładzie ostatniej z podanych wyżej 
macierzy. Wiersze tej macierzy oznaczymy dodat¬ 
kowo częstościami x t i x 2 , a kolumny częstościami 
Si i s 2 . Tak oznaczona macierz przedstawia się na¬ 
stępująco 




x 2 


Dla częstości obowiązują równania x t + x 2 = 1 oraz 
s x +s 2 = 1, stąd wynika, że x 2 = 1 —x 2 oraz s 2 = 
= 1— Ponieważ dla naszej macierzy zachodzi 
nierówność a ^ P, wynika konieczność określenia 
dla graczy ich optymalnych strategii mieszanych, tj. 
X* = (x lf x 2 ) dla gracza A oraz S* = (s lt s 2 ) dla 
gracza B. Wraz z wyznaczeniem optymalnych strategii 
mieszanych powinna zostać określona minimaksowa 
wartość gry, która jest jednocześnie średnią wygraną 
graczy. 

Przystępując do rozwiązania wychodzimy z zało¬ 
żenia, że wartość średniej wygranej v, którą uzyska 
gracz A stosując swoją strategię X*, nie powinna 
zależeć od tego, jaką strategię czystą będzie stosował 
w grze gracz B. Zgodnie z tym, przy stosowaniu 
przez gracza B strategii czystej Z x średnia wygrana 
gracza A będzie określona równaniem 

1 • X! + 3 • x 2 — v (2.1) 
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Natomiast przy zastosowaniu przez gracza B stra¬ 
tegii Z 2 obowiązuje róyraanie 

4 • * x +2 • x 2 = v (2.2) 

Biorąc pod uwagę, że x 2 — 1 — x u 'otrzymujemy 
układ równań 

1 • Xi + 3 (1— * x ) = v 
4 * * t + 2 (1— * x ) = v 

a następnie 

1* *i + 3 (1 —*i) = 4 • *i + 2(l —*i) 

Rozwiązując ostatnie równanie otrzymujemy 

1 

* 1=4 

, 3 

*2 = 1-*1 =-ą 

i- 

Podstawiając wartości * x i x 2 do równania ( 2 . 1 ) 
otrzymujemy ' 

' , 1 „3 1 

v = 1 • *! +3 • * 2 = 1 • — +3 • — = 2 — 

4 4 2 

Z kolei przystępujemy do określenia częstości y 2 i y 2 
dla gracza B. Rozumując analogicznie, jak w przy¬ 
padku gracza A, otrzymamy układ równań 

1 ‘ s t +4 • s 2 = v ( 2 . 3 ) 

3 • $ x + 2 • s 2 — v (2.4) 

Wykonując podobne przekształcenia otrzymamy 
1 -$ x +4(l — Sj) — 3 • ri+2(l— $ x ) 
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a następnie 


s i = 


2 


s 2 = 1-^ 


1 

2 


Podstawiwszy wartości i s 2 do równania (2.3) 
sprawdzamy, czy otrzymaliśmy tę samą wartość v, 
co dla gracza A 


1 • Si + 4 • s 2 = v 




1 _ 

2 


Odpowiedź jest pozytywna. 
Rozwiązanie gry jest więc następujące 

X* = (x» x 2 ) = 

s* = fe. .0 = (j. j) 



Z otrzymanego rozwiązania widać, że obliczone 
optymalne strategie mieszane graczy zapewniają 
im wygraną większą, niż to wynika z dolnej i górnej 
wartości gry. Interpretacja obliczonych średnich 
częstości Jti, x 2 , s t i s 2 jest taka, że gracz A w czterech 
partiach gry raz powinien zastosować strategię Y u 
a trzy razy strategię Y 2 , natomiast gracz B swoje 
strategie Z x i Z 2 powinien stosować na przemian 
— przy czym zmiany strategii powinny być doko¬ 
nywane losowo. W przypadku, gdy gra przedstawia 
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pewien proces jednorazowy, częstości x u x 2 oraz 
s 1} s 2 należy traktować jako prawdopodobieństwa, 
z jakimi obie strony gry uzyskać mogą optymalny 

wynik gry przy zastosowaniu tylko jednej ze swoich 
strategii czystych. 

W ogólnym przypadku nie wszystkie czyste stra¬ 
tegie, będące do dyspozycji danego gracza, wchodzą 
w skład jego optymalnej strategii mieszanej. Stra- 
tegie, które wchodzą w skład optymalnej strategii 
mieszanej danego gracza, będziemy nazywali jego 
strategiami korzystnymi. 

W grach otwartych charakterystyczne jest to, 
że o ile jeden z graczy, np. gracz A, stosuje swoją 
optymalną strategię mieszaną X *, to wygrana po¬ 
zostaje niezmienna i równa wartości gry v nieza¬ 
leżnie od tego, co czyni drugi gracz, byleby tylko nie 
wyszedł on poza zbiór swoich strategii korzystnych. 

Gdy gracz A zorientuje się, że gracz B stosuje 
strategię różną od swojej optymalnej strate gii S* 
i strategia ta znana jest graczowi A, to strategia X* 
przestaje byc optymalna dla gracza A, i korzystniej 
jest dla niego stosować pewną strategię czystą. 

A więc dla gier otwartych, podobnie jak i dla 
gier zamkniętych, obowiązuje ta sama zasada: dany 
gracz uzyskuje tym większą wygraną, im dysponuje 
większą ilością informacji o swym przeciw nik u 


Problem rozwiązywania gier 

Fundamentalnym twierdzeniem teorii gier, do¬ 
tyczącym gier dwuosobowych o sumie zerowej, jest 
twierdzenie minimaksowe udowodnione przez 
von Neumanna w 1928 r. Nieformalne wypowie¬ 
dzenie tego twierdzenia przedstawić można nastę- 
pująco: każda skończona gra dwu- 
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osobowa o sumie zerowej ma co naj¬ 
mniej jedno rozwiązanie, które 
określa wartość ^ry i optymalne 
strategie graczy. '-Dowody tego twierdzenia 
są dość złożone, natomiast interpretacja słowna 
jest bardzo prosta. Mianowicie każdą dwuosobową 
grę o sumie zerowej — skończoną i opisaną macierzą 
— możemy rozwiązać, przy czym rozwiązanie to 
można uzyskać w obszarze strategii czystych lub 
w obszarze strategii mieszanych. Gdy gra ma roz¬ 
wiązanie w obszarze strategii czystych, to k ażdy 
z graczy ma co najmniejjedaą czystąlstrategię opty¬ 
malną, która gwarantuje mu wygraną nie mniejszą 
od Wartości gry v określonej elementem macierzy gry. 
O grze - takiej mówimy, że jest zamknięta i ma punkt 
siodłowy w obszarze strategii czystych. Natomiast 
w przypadku, gdy gra ma rozwiązanie w obszarze 
strategii mieszanych, każdy z graczy ma co najmniej 
jedną optymalną strategię mieszaną, która gwaran¬ 
tuje mu wygraną nie mniejszą niż obliczona wartość 
gry v. Gra taka jest grą otwartą, a więc nie ma punktu 
siodłowego, który będąc elementem macierzy gry 
wyznaczałby wartość gry vĄ W tym przypadku war¬ 
tość gry należy obliczyć. Obliczona wartość gry jest 
punktem siodłowym w obszarze strategii mieszanych, 
a tym samym gra otwarta w obszarze strategii mie¬ 
szanych jest grą zamkniętą.. 

Tryb postępowania przy rozwiązywaniu dowolnej 
dwuosobowej gry o sumie zerowej jest ściśle okreś¬ 
lony. Mając zadaną macierz gry wyznaczamy dolną 
i górną wartość gry, porównujemy uzyskane wartości 
i w zależności od wyniku porównania określamy 
optymalne strategie graczy w obszarze strategii 
czystych lub mieszanych. Jeżeli gra nie ma rozwią¬ 
zania w obszarze strategii czystych, gdyż a =£ 6, 
to przed przystąpieniem do rozwiązywania gry 
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w obszarze strategii mieszanych wskazane jest prze¬ 
prowadzić, oczywiście o ile to możliwe, tzw. redukcję 
macierzy gry. Re dukcja m acierzy gry, inaczej mówiąc 
zmniejszenie jej rozmiarów, sprowadza się do wy¬ 
eliminowania z macierzy gry jawnie niekorzystnych 
strategii czystych obu graczy. Istnieje kilka metod 
redukcji macierzy gry. Stosunkowo najprostszą jest 
metoda, oparta na wykorzystaniu pojęcia strategii 
dominujących obu graczy. 

Strategią dominującą danego gracza nazywamy 
taką strategię, która jest lepsza od innych strategii 
tego gracza. Strategie dominujące graczy określamy 
z macierzy gry. Dla gracza A strategie dominujące 
wyznaczamy w ten sposób, że porównujemy parami 
wiersze macierzy gry. Jeżeli w trakcie takiego po¬ 
równania stwierdzimy, że elementy a u wiersza Y t 
macierzy gry są większe lub równe odpowiednim 
elementom a kJ wiersza Y k , tzn. spełniona jest nie¬ 
równość a u > a kJ dla wszystkich j = 1, 2, ..., n, 
to mówimy, że strategia Yt jest strategią dominującą 
nad strategią Y k . Gdy strategia Y t dominuje nad stra¬ 
tegią Y k , to strategia Y k jako strategia dominowana 
podlega wykreśleniu z macierzy gry. Podobnie wy¬ 
znaczamy strategie dominujące gracza B, a miano¬ 
wicie porównujemy parami kolumny macierzy gry. 
Jeżeli w trakcie takiego porównania stwier dzimy 
że elementy a tJ kolumny Z, nie są większe, lecz 
najwyżej równe odpowiadającym im elementom a is 
kolumny Z s , tzn. spełniona jest nierówność a l} « a u 
dla wszystkich i = 1, 2, ..., m, to mówimy, że stra¬ 
tegia Z } jest strategią dominującą nad strategią Z s . 
W tym przypadku strategia Z s , dominowana przez 
strategię Z h podlega wykreśleniu z macierzy gry. 

W ogólnym przypadku w macierzy gry dla każdego 
z graczy możemy wyróżnić kilka strategii domi¬ 
nujących. Po przeprowadzonej redukcji, w zreduko- 
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wanej macierzy gry zostaną tylko te strategie czyste, 
które nie są dominowane przez żadne inne. 

Dla przykładu rozpatrzmy następującą macierz gry 
typu 5x5 
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Dla macierzy tej a = 1 i P = 2, a więc brak punktu 
siodłowego. W celu określenia strategii dominujących 
gracza A oraz odpowiadających im strategii domi¬ 
nowanych porównujemy parami wiersze przed¬ 
stawionej macierzy. W trakcie porównywania łatwo 
Stwierdzimy, że każdy element a lJ wiersza Y ± jest 
większy lub równy odpowiadającemu mu elemen¬ 
towi a 4j wiersza Y 4 , a więc strategia Y x dominuje 
nad strategią Y 4 . Analogiczny wynik uzyskamy 
z porównania wierszy Y 2 i Y s , w tym przypadku 
strategia Y 2 dominuje nad strategią Y s . Stąd wniosek, 
że wiersze Y 4 i Y s podlegają wykreśleniu z macierzy 
gry. Następnie przechodzimy do porównywar' 
kolumn macierzy gry, w wyniku czego stwierdź 



ze każdy element a l2 kolumny Z 2 jest mniejszy lub 
najwyżej równy odpowiadającemu mu elementowi a-, 
kolumny Z 4 . Strategia Z 2 dominuje więc nad stra¬ 
tegią Z 4 . Podobnie strategia Z 3 dominuje nad stra¬ 
tegią Z 5 . 

Wykreślając z przedstawionej macierzy gry stra¬ 
tegie F 4 i F s gracza A oraz strategie Z 4 i Z 5 gracza B 
uzyskamy następującą zredukowaną macierz gry 
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Macierz ta opisuje grę typu 3x3, której rozwiązanie 
znajduje się w obszarze strategii mieszanych, gdyż 
a ^ p. Do rozwiązania tej gry nie można jednak 
wykorzystać metody przedstawionej w poprzednim 
punkcie na przykładzie rozwiązania gry 2x2, gdyż 
w grze 3x3 liczba niewiadomych, tj. x u x 2 , x 3 , 
s i> s 2 > s 3 , v, jest znacznie większa niż dla gry 2x2! 
Jedna z najprostszych metod rozwiązania gry 3x3 
zostanie przedstawiona poniżej. W metodzie tej 
posługiwać się będziemy pojęciem częstości 

względnej, stąd też na początku scharaktery¬ 
zujemy to pojęcie. 

. Względna, częstość jest pewną wielkością umowną 
1 wyrażana jest liczbą całkowitą. Jeżeli np. z rozwią- 


46 



zania gry w obszarze strategii mieszanych wynika, 
że gracz A na 13 partii powinien zastosować 8 razy 
strategię czystą Y ly a 5 razy strategię Y 2 , to liczba 8 
jest względną częstością strategii Y u a liczba 5 wzglę¬ 
dną częstością strategii Y 2 . Natomiast sam stosunek 
8 : 5 określa optymalną strategię mieszaną gracza A. 

Wróćmy teraz do naszej przykładowej macierzy 
gry i postarajmy się najpierw określić względne 
częstości strategii gracza B. W tym celu odejmujemy 
każdy wiersz macierzy od wiersza znajdującego się 
nad nim, tj. każdą wypłatę a tJ od wypłaty znajdu¬ 
jącej się nad nią, tzn. od wypłaty a,_, W wyniku 
otrzymamy następującą macierz zastępczą 
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Wykreślając z tej macierzy kolumnę Z x otrzymamy 
macierz 
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Obliczając różnicę iloczynów liczb leżących na prze¬ 
kątnych tej macierzy, określimy względną częstość 
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strategii Z u którą oznaczymy symbolem s[. Z obli¬ 
czeń wynika, że: 



2' (— 5)— (—8) ’ 5 = 30 


Analogicznie postępujemy przy określaniu względnych 
częstości dla strategii Z 2 i Z 3 . Wykreślając odpo¬ 
wiednie kolumny z macierzy zastępczej i wykonując 
obliczenia otrzymamy 
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(-!)’'(—S)-3 -5 = -10 
s 2 = 10 


(—1) ‘ (—8)—2 • 3 =[2 
1 s' 3 = 2 


Względne częstości strategii czystych gracza B wy¬ 
noszą więc odpowiednio: jj = 30, s' z = 10, s 3 - 2; 
ewentualny znak minus przy wynikach obliczeń jest 
pomijany, stąd s' 2 = 10, a nie -10. Optymalna 
strategia mieszana gracza B, określona we względnych 
częstościach, wynosi 30 : 10 : 2. 

Mając obliczone względne częstości s[, s’ 2 , s 3 , 
możemy obliczyć częstości s u s 2 , s 3 w następujący 
sposób' ... V. 
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s =* .y^+jj+Sj = 30+10 + 2 = 42 
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Optymalna strategia mieszana gracza B wyrażona 
w częstościach s u s 2 , s 3 wyniesie 


S* = (s lt s 2 , s 3 ) = 


30 10 2 

42’ 42’ 42 


Z kolei przystępujemy do wyznaczenia względnych 
częstości dla poszczególnych strategii gracza +. 
W tym też celu odejmujemy w macierzy gry każdą 
kolumnę od kolumny, która znajduje się z jej lewej 
strony, w ten sposób, że każdą wypłatę a u kolumny Z } 
odejmujemy od odpowiadającej jej wypłaty 
kolumny Źj~ x . Zapisując odpowiednio wyniki odej¬ 
mowania otrzymamy następującą macierz zastępczą 
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Wykreślając z macierzy zastępczej wartości wiersza Yj 
otrzymujemy macierz 
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Y x 
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Obliczając różnicę iloczynów liczb stojących na 
przekątnych tej macierzy otrzymamy wartość względ¬ 
nej częstości strategii Y x , tj. 

*i = l-9-(-2)*(-2) = 5 


Postępując analogicznie przy określeniu względnych 
częstości strategii Y 2 i Y 3 otrzymujemy 
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1 • 6—(—2) • (-5) = -4 
x' 2 = 4 


(-2)-6-9-(-5) = 33 
= 33 


Względne częstości strategii czystych gracza A wyno¬ 
szą więc odpowiednio x\ = 5, x' 2 = 4, = 33, 
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a optymalna strategia mieszana określona w tych 
częstościach wynosi 5 : 4 : 33. 

Obliczając z kolei częstości x u x 2 , x 3 otrzymujemy 

x = x'i + X 2 +x 3 = 5 + 4 + 33 = 42 
_ Xi _ 5 
Xl x 42 

x' 2 4 

Xl x 42 

_ x' 3 _ 33 
* 3 “ x “42 


Optymalna strategia mieszana gracza A wyrażona 
w częstościach x t , x 2 , x 3 przedstawia się więc na¬ 
stępująco 


X* = (x u x 2) x 3 ) = 


5 4 33 

42’ 42’ 42 


Znając już optymalne strategie mieszane graczy, tj. 
X* dla gracza + i S* dla gracza B, możemy przystąpić 
do obliczenia minimaksowej wartości gry v. Posłu¬ 
gujemy się przy tym wskazaną już wyżej prawidło¬ 
wością, że przy zastosowaniu przez dowolnego 
z graczy jego optymalnej strategii mieszanej wygrana 
tego gracza powinna być równa minimaksowej 
wartości gry v, niezależnie od tego, jaką strategię 
czystą będzie stosował jego przeciwnik. 

Należy więc sprawdzić, czy tak jest istotnie. Za¬ 
kładając, że gracz A stosuje strategię mieszaną X*, 
a gracz B strategię czystą Z t , wygrana gracza + 
wyniesie 

, v = 3 • x 1 +4 • x 2 + l • x 3 = 


= 3 • 
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Przy zastosowaniu przez gracza B innej strategii 
czystej wygrana gracza A wyniesie 

dla Z 2 : v = (—3) • Xi+(—5) • x 2 +3 • x 3 = 1 11 

ł 

dla Z 3 : v = 2-^ + (-3) • x 2 +2-x 3 = [lll 

Postępując analogicznie przy określaniu wygranej 
gracza B, przy założeniu, że gracz A stosuje strategię 
czystą, otrzymamy 

dla 3^: v = 3 • Ji + (—3) • j 2 +2 • s 3 = 


dla Y 2 : 


dla Y 3 : 


■ 30 „ 10 2 

3- ^=--3*— +2 


42 


42 


42 


11 

21 


v 


4- Ji + (-5)* s 2 +(-3)- s 3 = 1 


21 


v = 1 • ji + 3 • s 2 + 2 ' s 3 = 1 


21 


Z przedstawionych obliczeń wynika, że za każdym 
razem wartość v jest ta sama. Rozwiązanie gry jest 
więc właściwe, a wynikająca ze sprawdzenia wielkość v 
jest minimaksową wartością gry. 

Stosując taką samą metodę do rozwiązania gry 
podanej w przykładzie 1 (s. 25) otrzymamy następu¬ 
jący wynik 




S* = 
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4’ 2’ 4 


v =0. 
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W dotychczasowych naszych rozważaniach ogra¬ 
niczyliśmy się wyłącznie do przedstawienia metod 
rozwiązywania gier 2 x 2 i 3 x 3. Metody te z pewną 
modyfikacją możemy zastosować również do roz¬ 
wiązywania gier 2xn, m x 2, 3 x /i i mx3. Pomocne 
jest tutaj istniejące w teorii gier twierdzenie, mówiące 
o tym, że dla dowolnej gry mxn istnieje takie roz¬ 
wiązanie, w którym liczba strategii korzystnych 
dla każdej z dwóch stron gry nie jest większa od 
mniejszej liczby spośród liczb m i n. Na podstawie 
tego twierdzenia, po zastosowaniu odpowiedniej 
metody redukcji macierzy gry, grę typu 2 x/z lub 
7wx2 można sprowadzić do postaci gry 2x2. Po¬ 
dobnie grę 3x71 lub m x 3 można sprowadzić do 
postaci gry 3x3. 

Gdy liczba strategii każdego z graczy jest większa 
od czterech, rozwiązanie gry mxn jest dość trudnym 
zadaniem, przy czym złożoność zadania i ilość obli¬ 
czeń potrzebnych do rozwiązania rośnie gwałtownie 
ze wzrostem min. Do rozwiązywania takich gier 
wykorzystuje się najczęściej metody programowania 
liniowego i metody iteracyjne. 

Posługiwanie się tymi metodami jest związane 
z koniecznością przeprowadzenia dużej ilości obli¬ 
czeń. Bardzo często liczba ich jest tak duża, że unie¬ 
możliwia rozwiązanie gry drogą odręcznych obliczeń. 
Narzuca się więc potrzeba wykorzystania do tego 
celu maszyny cyfrowej. Jako przykład niech służy 
fakt, że rozwiązanie gry dwuosobowej o sumie ze¬ 
rowej w obszarze strategii mieszanych przy macierzy 
gry typu 100 x 100 jest związane z wykonaniem 
ponad 8 milionów elementarnych operacji arytme¬ 
tycznych. Aby wykonać tyle operacji, jeden człowiek 
biegły w działaniach matematycznych musiałby liczyć 
bez przerwy około 16 666 godzin, czyli 694 doby. 
Wykorzystując do tego celu maszynę cyfrową o śred- 
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niej szybkości obliczeń uzyskamy rozwiązanie gry 
w przeciągu około jednej minuty. Z podanego przy¬ 
kładu wynika więc, że maszyna cyfrowa jest jedynym 
i niezmiernie użytecznym urządzeniem umożliwia¬ 
jącym rozwiązywanie gier o dużej liczbie strategii. 



3 


Gry wielochodowe 


Pojęcie gry wielochodowej 

Omówiona w poprzednim rozdziale postać 
normalna gry dwuosobowej charakteryzuje się sto¬ 
sunkowo prostą strukturą, która przydatna jest do 
analizy matematycznej, a tym samym ułatwia roz¬ 
wiązanie gry przez określenie optymalnych strategii 
graczy i wartości gry. Jednakże samo przedstawienie 
gry dwuosobowej w postaci normalnej jest problemem 
bardzo złożonym, gdyż sprowadzenie większości 
konkretnych gier do postaci normalnej przekracza 
ludzkie możliwości. Na przykład przedstawienie gry 
w szachy w postaci normalnej, pomimo że gra ta ma 
punkt siodłowy w obszarze strategii czystych, jest 
obecnie jeszcze zamierzeniem nierealnym ze względu 
na olbrzymią ilość strategii czystych obu graczy. 
Ponadto należy zauważyć, że szereg sytuacji kon¬ 
fliktowych dotyczy procesów wieloetapowych. 

Opisanie tych procesów modelem gry w postaci 
normalnej jest sprzeczne z charakterem przebiegu 
samego procesu i w praktyce jest mało przydatne. 
Niemożliwość wyrażenia wielu gier przy pomocy 
macierzy gry przyczynia się do tego, że zakres wy¬ 
korzystania postaci normalnej gry do opisu sytuacji 
konfliktowych jest poważnie ograniczony. 
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Pierwotnym modelem większości gier dwuosobo¬ 
wych jest ich p^ać^jeksteiis ywna , znana pod nazwą 
gry wielochott g^ fTW grze wielochodowej poszcze- 
gólne ruchy graczy wykonywane są nie jednocześnie, 
ale na przemian, W trakcie ruchów gracze dokonują 
wyborów ze zbioru przyporządkowanych im alter¬ 
natyw. Alternatywa nosi nazwę strategii chodowej, 
a zbiór alternatyw danego gracza jest zbiorem jego 
strategii chodowych. 

Ograniczając nasze rozważania wyłącznie do gry 
dwuosobowej, będziemy przyjmować, że zbiór stra¬ 
tegii chodowych gracza A wyraża się postacią 

Y — (yx, y2> •••> yt ••• > Fw} (3.1) 
gdzie y f — i-ta strategia chodowa gracza A. 

Przedstawiony przez nas zbiór F jest zbiorem 
pewnych elementów abstrakcyjnych (symboli), 
z których każdy wyraża ściśle określoną strategię 
chodową gracza A. Fakt, że dany element y { jest 
elementem zbioru F będziemy zapisywać w postaci 
y t e Y i czytać, że y t należy do zbioru Y (znak e 
oznacza przynależność elementu do zbioru; stanowi 
pierwszą literę greckiego słowa e cni — jest). Bardzo 
często, przy rozpatrywaniu zbiorów, zachodzi ko¬ 
nieczność podzielenia danego zbioru na określone 
podzbiory. Na przykład zbiór Y można byłoby 
podzielić na dwie części, tj. na dwa podzbiory F (1) 
i Y i2 \ przy czym podzbiór F U) mógłby zawierać te 
strategie chodowe gracza A, które są dla niego ko¬ 
rzystne, natomiast podzbiór F (2) mógłby zawierać 
te strategie chodowe gracza A, które są dla niego 
niekorzystne. Zarówno podzbiór F (1) , jak i F <2) 
rozpatrywane oddzielnie są zbiorami określonych 
elementów y t . Fakt, że dany zbiór, np. F (1) , jest 
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zawarty w zbiorze Y, tzn. jest jego podzbiorem, 
będziemy zapisywać w postaci Y w <= Y. Symbol c 
nazywamy znakiem inkluzji i stosujemy dla ozna¬ 
czenia faktu, że dany zbiór jest częścią składową 
jakiegoś innego zbioru. 

Po tej krótkiej uwadze wróćmy do drugiego z na¬ 
szych graczy, tj. do gracza B. W grze wielochodowej 
gracz B jest przeciwnikiem gracza A i jako taki 
również dysponuje zbiorem możliwych do zastoso¬ 
wania strategii chodowych. Analogicznie do zbioni Y 
zbiór strategii chodowych gracza B oznaczać będziemy 
następująco 

Z — ••• » 0*^) 

gdzie z s — ;'-ta strategia chodowa gracza B. 

Ciąg wyborów dokonywanych przez graczy na 
przemian, począwszy od momentu rozpoczęcia gry 
aż do jej zakończenia, nosi nazwę partii.. Każda 
partia doprowadza do odpowiedniego wyniku gry, 
korzystnego dla jednego lub drugiego gracza, lub 
też do remisu. Na partię gry wielochodowej składa 
się ściśle określony ciąg strategii chodowych gracza A 
i gracza B. Zastosowany w dowolnej partu ciąg 
strategii chodowych danego gracza nosi nazwę 
strategii pełnej tego gracza. Strategia pełna w grze 
wielochodowej jest odpowiednikiem strategii czystej 
w grze wyrażonej postacią normalną. Gdy dla danej 
gry wielochodowej istnieje możliwość określenia 
wszystkich strategii pełnych obu graczy,, grę taką 
możemy przedstawić w postaci normalnej — oczy¬ 
wiście, jeżeli liczba strategii pełnych me jest zbyt 
duża. Podobnie grę przedstawioną w postaci normal¬ 
nej można przedstawić w postaci ekstensywnej, 
dzieląc umownie strategie czyste na pewne strategie 
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chodowe oraz zakładając, że partnerzy wykonują 
swoje ruchy nie jednocześnie, lecz na przemian. 
W grze wielochodowej charakterystyczne jest to, 
że nie wolno nam izolować i abstrahować każdego’ 
ruchu oddzielnie, ponieważ znaczenie jego w grze 
zależy także od niektórych innych nichów. Miano¬ 
wicie — wartość wyboru konkretnej strategii cho¬ 
dowej przez gracza zależy zarówno od wyborów 
dokonanych przez tego gracza w poprzednich ru¬ 
chach, jak i od wyborów dokonanych przez jego 
przeciwnika. 


Dendryt gry 

Najwygodniejszą do analizy postacią przed¬ 
stawienia gier wielochodowych jest postać graficzna. 
Przy przedstawieniu gry wielochodowej w postaci 
graficznej posługujemy się pojęciem grafu. Graf jest 
figurą geometryczną składającą się ze skończonej 
liczby punktów zwanych wierzchołkami oraz z łączą¬ 
cych je odcinków lub łuków zwanych krawę dziami 
Graf przedstawiający grę wielochodową ze względu 
na swą strukturę nosi nazwę dendrytu gry lub drzewa 

gry- 

Wyjaśnienie pojęcia drzewa (dendrytu) gry po¬ 
przedzimy pewną opowiastką baśniową, która ułatwi 
nam niewątpliwie zrozumienie ppstaci graficznej grv 
wielochodowej. . 

Dwa krasnoludki, czarny i biały, postanowiły 
wybrać się na wycieczkę w głąb rozłożystej jabłoni. 
Aby uprzyjemnić wycieczkę i nadać jej jakiś cel, 
krasnoludki potraktowały swoją wycieczkę jako 
pewnego rodzaju grę dwuosobową. Opracowane 
przez nich reguły gry sprowadzały się do tego, że 
gracz A będzie wpływał na przebieg wycieczki tak, 
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aby dojść do tego punktu jabłoni, w którym znaj¬ 
duje się możliwie największe jabłko, natomiast 
gracz B tak, aby zakończyła się ona w tym punkcie 
jabłoni, w którym nie ma żadnego jabłka lub znaj¬ 
duje się jabłko możliwie najmniejsze. 

Z reguł gry wynika, że przedsięwzięcia podejmo¬ 
wane przez krasnoludki w trakcie wycieczki będą 
sobie przeciwstawne. Krasnoludki wiedziały, że 
wycieczka dojdzie do skutku tylko wtedy, gdy de¬ 
cyzje dotyczące wyboru kierunku marszruty będą 
podejmowane nie jednocześnie przez obydwóch, 
lecz na przemian przez każdego z nich. Po przepro¬ 
wadzonej naradzie ustalono więc, że prawo wyboru 
kierunku marszruty ma przewodnik wycieczki, przy 
czym w każdym punkcie rozgałęzienia gałęzi jabłoni 
następuje zmiana przewodnika. Zgodnie z tym przy¬ 
jęto, że najpierw przewodnikiem będzie gracz B, 
następnie gracz A, później znów gracz B, gracz A 
itd., aż do osiągnięcia takiego punktu w koronie 
jabłoni, który jest punktem zakończenia gry. Przy¬ 
stępując do realizacji „wycieczki — gry”, krasno¬ 
ludki drogą losowania ustaliły, że graczem B będzie 
krasnoludek biały, a graczem A — krasnoludek 
czarny. Właściwa gra rozpoczyna się przy napotka¬ 
niu pierwszego rozgałęzienia; gracz B dokonuje wów¬ 
czas wyboru kierunku marszruty, przy napotkaniu 
następnego rozgałęzienia wyboru kierunku marszruty 
dokonuje gracz A itd. 

Wynik gry zależny jest od dokonywanych przez 
graczy A i B wyborów kierunków marszrut. Powyż¬ 
sza gra jest grą dwuosobową, a jej postacią graficzną 
jest drzewo gry, którego struktura, określona kon¬ 
figuracją krawędzi i wierzchołków, odpowiada struk¬ 
turze jabłoni. Oczywiście przy takim odwzorowaniu 
struktury jabłoni strukturą drzewa gry, gałęzie 
jabłoni reprezentowane są przez linie proste, a pier- 
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wsze rozgałęzienie jabłoni jest wierzchołkiem po¬ 
czątkowym drzewa (dendrytu) gry. 

W dalszych naszych rozważaniach termin „drzewo 
g f y , będziemy zastępować terminem „dendryt gry” 
ponieważ w polskiej literaturze naukowej termin 
„dendryt jest bardziej popularny i częściej spo¬ 
tykany. Przykładowy dendryt gry dla pewnej fik¬ 
cyjnej gry, podobnej do zilustrowanej wyżej ery 
krasnoludków, przedstawiony został na ryc. 1. 



Wśród wierzchołków dendrytu gry wyróżnia się: 
wierzchołek początkowy, zwany często korzeniem 
dendrytu, wierzchołki leżące na różnych poziomach 
dendrytu oraz wierzchołki końcowe. Wierzchołki 
dendrytu odzwierciedlają sytuację powstałą w grze. 
Każdy wierzchołek dendrytu, z wyjątkiem końco¬ 
wych, jest opisany symbolem gracza wykonującego 
ruch w danej sytuacji, ą przy każdym wierzchołku 
końcowym podaje się przyporządkowany mu koń¬ 
cowy wynik gry. Krawędzie dendrytu reprezentują 
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strategie chodowe, które gracze mogą wykonać 
w procesie realizacji gry, stąd też krawędzie opisane 
są symbolami z s lub y r przynależnymi do zbioru 
możliwych strategii chodowych graczy. Dendryt 
o m wierzchołkach ma m— 1 krawędzi i jest grafem 
spójnym. Spójność dendrytu wynika z tego, że można 
w nim wyodrębnić dokładnie tylko jedną trasę (łuk), 
łączącą dowolną parę wierzchołków. Łuk łączący 
wierzchołek początkowy dendrytu z jednym z wierz¬ 
chołków końcowych dendrytu jest ścieżką dendrytu. 
Ścieżka taka reprezentuje partię gry. Pomimo że 
w dendrycie gry krawędziom nie nadaje się żadnego 
kierunku (brak strzałek), przyjmuje się umownie, 
że dendryt gry jest grafem skierowanym, gdyż opisuje 
proces przebiegający w kierunku od wierzchołka 
początkowego do jednego z wierzchołków końco¬ 
wych dendrytu. Dendryt jest podzielony na piętra, 
przy czym numer dowolnego piętra jest zgodny 
z numerem porządkowym odpowiadającego mu 
posunięcia w grze. Posunięcie obejmuje ruch gracza 
rozpoczynającego grę oraz odpowiedź na ten ruch 
jego przeciwnika. 

W celu określenia położenia wierzchołków w den¬ 
drycie, każdy z nich — z wyjątkiem końcowych 
— opisano symbolem partnera wykonującego ruch 
w sytuacji, oznaczonej tym wierzchołkiem, i oprócz 
tego oznaczono dwiema współrzędnymi n i k. 
Współrzędna n wskazuje numer piętra, w którym 
wierzchołek się znajduje, natomiast współrzędna k 
określa numer porządkowy danego wierzchołka 
w piętrze n. Kompletny symbol opisujący wierz¬ 
chołek ma więc postać lub B?, gdzie n = 0, 1, 
2,..., m. Wierzchołki końcowe dendrytu są punktami 
zakończenia gry i charakteryzują te partie gry, które 
do nich doprowadzają. Każdemu wierzchołkowi 
dendrytu jest przyporządkowany tylko jeden wynik 
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gry, będący elementem zbioru R = {p 1? p 2 . p s> 

... p,} obejmującego wszystkie możliwe wynikigry! 
Wyniki gry mogą być wyrażone liczbowo lub w po¬ 
staci symboli, np. dla gry w szachy zbiór R zawiera 
tylko trzy elementy wyróżnione w dendrycie gry 
różnym kształtem wierzchołków końcowych. Dla 
gry przedstawionej dendrytem z ryc. 1 zbiór R przed¬ 
stawia się następująco: 

R= { — 9, -8, -7, -6, -5, -1,0,1,5,6,9,10,14,15} 

Dendryt gry ilustruje wszystkie możliwe warianty 
rozegrania gry, którą przedstawia. Dla przykładu 
rozpatrzmy przebieg gry na podstawie dendrytu 
z ryc. 1. 

Grę prowadzi dwóch graczy: A i B. Celem gry 
jest uzyskanie jak największej wygranej przez każdego 
z graczy kosztem przegranej swego przeciwnika. 
Zbiór możliwych strategii chodowych gracza A 
wynosi Y = {y u j 2 }, natomiast zbiór możliwych 
strategii chodowych gracza B wynosi Z = {z 
^2} • 

Zgodnie z przedstawionym dendrytem, grę roz¬ 
poczyna gracz B , dlatego też wierzchołek początkowy 
dendrytu jest opisany symbolem B\. Na początku gry, 
tj. w sytuacji określonej wierzchołkiem B\, gracz B 
może zastosować strategię chodową z 1 lub z 2 . Gdy 
gracz B zastosuje strategię chodową z 2 , powstaje 
sytuacja opisana wierzchołkiem A\ dendrytu. Nato¬ 
miast gdy gracz B zastosuje strategię chodową z 2 , 
sytuacja powstała w grze jest określona wierzchołkiem 
A 2 dendrytu. Realizacja następnego ruchu w pier¬ 
wszym posunięciu należy do gracza A. Zarówno 
w sytuacji A\ jak i A\ gracz A może zastosować 
strategię chodową y t lub y 2 , a więc w zależności od 
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wyboru gracza 2? dokonanego w pierwszym posu¬ 
nięciu i odpowiedzi na ten wybór gracza A w tym 
posunięciu, sytuację powstałą po pierwszym po¬ 
sunięciu jednoznacznie określa jeden z wierzchołków 
B\, B\, B\, B\. Analogiczny proces wystąpi w trak¬ 
cie realizacji drugiego posunięcia. 

W rozpatrywanej grze każdy z graczy może za¬ 
stosować ściśle określoną strategię postępowania, 
która jest kombinacją dwóch możliwych strategii 
chodowych danego gracza i doprowadza do jednego 
z wierzchołków końcowych dendrytu. Kombinacja 
strategii chodowych danego gracza, przyporządko¬ 
wana jednej ze ścieżek dendrytu, jest strategią pełną 
tego gracza. Na przykład na ryc. 1 druga z prawej 
strony ścieżka dendrytu jest opisana następującym 
ciągiem symboli: z l y 1 z x y 2 . Ciąg ten wyraża strategię 
pełną gracza B w postaci kombinacji z y z 2 oraz stra¬ 
tegię pełną gracza A w postaci kombinacji y x y 2 . 
Inaczej mówiąc, strategią pełną danego gracza 
będzie uporządkowany ciąg jego strategii chodowych 
występujących w opisie jednej ze ścieżek dendrytu. 
W rozpatrywanej grze każdy z graczy ma do dyspo¬ 
zycji cztery następujące strategie pełne 


dla gracza A 
Y 1 = y 1 y 1 
Y 2 = y, y 2 
y 3 = y 2 yi 
y 4 = y 2 y 2 


dla gracza B 

typ typ 

-- 1 - ^ 

3 “ Z Z Z 1 

typ typ 

mmf 


Znając strategie pełne graczy, możemy przejść od 
postaci ekstensywnej gry do postaci normalnej, 
przedstawionej następującą macierzą 
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Jak łatwo zauważyć, gra ta ma punkt siodłowy 
w obszarze strategii czystych, a minimaksowa war¬ 
tość gry wynosi v = 0. Optymalną strategią czystą 
gracza A jest strategia Y 2j natomiast optymalną stra¬ 
tegią czystą gracza B jest strategia Z 4 . Oczywiście 
optymalne strategie czyste określone na podstawie 
macierzy gry są również optymalnymi strategiami 
pełnymi w grze wielochodowej. Ze względu na cha¬ 
rakter przebiegu gry wielochodowej przejście z po¬ 
staci ekstensywnej na postać normalną jest uzasad¬ 
nione tylko wtedy, gdy obaj partnerzy są rozumni 
i dążą do zapewnienia sobie największej wygranej. 
Jeżeli natomiast jeden z graczy będzie stosował 
swoje strategie chodowe w sposób losowy lub też 
będzie popełniał błędy w poszczególnych ruchach, to 
znajomość optymalnej strategii pełnej przez drugiego 
gracza jest dla niego mało przydatna. Wynika to 
z tego, że ten drugi gracz, jako bardziej rozumny 
partner, będzie dążył do wykorzystania błędów 
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popełnianych przez swego przeciwnika w celujzmaksy- 
malizowania swojej wygranej. Maksymalizację m 
może sobie zapewnić wyłącznie przez odstępstw# 
od swej optymalnej strategii pełnej. Można więc 
stwierdzić, że postać normalna dla gry wielochodo- 
wej ułatwia jej rozwiązanie, lecz nie wnika w proces 
realizacji gry wielochodowej. 


Gry z pełną informacją 

Jak już wiadomo, proces prowadzenia gry 
wielochodowej charakteryzuje się tym, że ruchy 
graczy są wykonywane nie jednocześnie, ale na prze¬ 
mian. Przy takim prowadzeniu gry podział gier 
wielochodowych jest zdeterminowany zasobem po¬ 
siadanej przez każdego z graczy informacji o ruchach 
swego przeciwnika. Jeżeli w trakcie realizacji gry 
wielochodowej każdy z graczy jest poinformowany 
o wyborach dokonywanych przez swego przeciwnika 
w przyporządkowanych mu ruchach, to wówczas 
powiemy, że gracze dysponują pełną informacją 
o przebiegu gry, a samą grę nazwiemy grą z pełną 
informacją. Gdy natomiast w grze wielochodowej 
co najmniej jeden z graczy nie zna wyborów doko¬ 
nywanych przez jego przeciwnika w kolejnych ru¬ 
chach, grę taką nazwiemy grą z niepełną informacją. 

Na początku scharakteryzujemy gry wielocho- 
dowe z pełną informacją. Przykładem ich są takie 
gry, jak warcaby, kółko i krzyżyk, szachy. W do¬ 
wolnej sytuacji, powstałej w trakcie prowadzenia 
gry wielochodowej z pełną informacją, gracze zawsze 
wiedzą, w jakim wierzchołku dendrytu sytuacja ta 
się znajduje. Oczywiście bardzo często dendryt gry 
jest pojęciem czysto abstrakcyjnym, gdyż nie można 
go narysować ze względu na olbrzymią liczbę strategii 


5 Teoria gier w cybernetyce 
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pełnych graczy. Nie przeszkadza to jednak w posłu¬ 
giwaniu się tym pojęciem, gdyż ułatwia ono analizę 
przebiegu gry, tym bardziej że w trakcie realizacji 
gry jest budowana jedna ze ścieżek dendrytu która 
zawsze możemy sobie narysować. ' ’ * 

Gra wielochodowa z pełną informacją może być 
skończona lub nieskończona. Gra skończona charak¬ 
teryzuje się tym, że każdy z graczy ma skończoną 
liczbę strategii pełnych. Dendryt takiej gry jest 
również skończony, tzn, po narysowaniu dendrytu 
— oczywiście, o ile to możliwe — będzie w nim 
skończona liczba ścieżek. Gdy liczba strategii pełnych 
graczy jest nieskończona, dendryt gry jest również 
nieskończony, a sama gra należy do klasy gier nie¬ 
skończonych. W teorii gier istnieje łatwe do udo¬ 
wodnienia twierdzenie, że każda dwuosobowa gra 
wielochodowa z pełną informacją i o sumie zerowej 
ma punkt siodłowy. Punkt ten można jednoznacznie 
określić, gdy dendryt gry jest skończony. Dokonuje 
się wówczas przejścia z postaci ekstensywnej do 
postaci normalnej gry opisanej macierzą. Na pod¬ 
stawie macierzy gry bez trudności można określić 
punkt siodłowy gry oraz optymalne strategie pełne 
(czyste) graczy, tak jak to przedstawiono w po¬ 
przednim punkcie niniejszego rozdziału. 

Rozpatrzmy obecnie przykład gry wielochodowej 
z pełną informacją, co ułatwi nam również zrozu¬ 
mienie rozdziału 7 książki. 

Przykład 3 — gra „Samochód policyjny” 

Na ulicach miasta rozgrywa się pościg za ucie- 
kąjąeą grupą przestępców. Obiektem ścigającym jest 
samochód policyjny A, obiektem uciekającym — sa¬ 
mochód przestępców B. Ulice miasta przecinają się 
pod kątem prostym i tworzą siatkę złożoną z jedna¬ 
kowych kwadratów. Szybkość samochodu A jest ' 
dwa razy większa od szybkości samochodu B, tzn. 
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v a = 2F b , gdzie V A , V B — szybkości samochodów 
nie zmieniające się w czasie. Przyjmując, że decyzje 
dotyczące kierunków jazdy samochodów są podej¬ 
mowane przez dysponentów samochodów na prze¬ 
mian i realizowane w ściśle określonych momentach 
czasu, powyższy pościg można potraktować jako 
proces prowadzenia dwuosobowej gry wielocho- 
dowej. Przyjmując dodatkowo założenie, że w trakcie 
realizacji procesu pościgu i ucieczki gracze znają 
nawzajem swoje kolejne położenia, grę tę zaliczymy 
do gier z pełną informacją. Dla uproszczenia modelu 



gry pomijamy, w jaki sposób każdy z graczy uzyskuje 
informację o położeniu swego przeciwnika i podejmo¬ 
wanych przez niego decyzjach. Szkic sytuacyjny 
gry przedstawiony został na ryc. 2. 
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Celem gry dla gracza A jest zbliżenie się do samo¬ 
chodu B w jak najkrótszym czasie na dostatecznie 
bliską odległość s, spełniającą warunek s < l, gdzie 
‘ długość boku pojedynczego kwadratu siatki 
z ryc. 2. Zgodnie z tym warunkiem doścignięcie samo¬ 
chodu B przez samochód A nastąpi-wtedy, gdy ru¬ 
chome punkty A i B na. rycinie pokryją się lub znajdą 
w sąsiadujących ze sobą węzłach siatki. Natomiast 
celem gry dla gracza B jest uniknięcie schwytania 
lub wydłużenie czasu, w którym ono nastąpi. Wy¬ 
płatą w grze jest liczba posunięć, po których obiekt B 
zostanie przechwycony przez A. Oczywiście A dąży 
do zmniejszenia tej liczby, a B do jej zwiększenia. 

Posługując się ryc. 2 prześledźmy teraz jeden 
z możliwych przebiegów tej gry. W początkowej 
sytuacji gry obiekt A znajduje się w punkcie H 0 , 
obiekt B w punkcie E 0 . Każdy z graczy ma do 
dyspozycji cztery możliwe strategie chodowe, które 
są dopuszczalnymi kierunkami przemieszczania się 
obiektów. Strategie te przedstawiono na ryc. 2 od¬ 
powiednim układem wektorów. Ponieważ V A = 
= const i V B = const oraz V A = 2 V B , pożądane 
jest przyjąć stałą jednostkę czasu T, w której obiekt B, 
realizując swoją dowolną strategię chodową, prze¬ 
bywa drogę s = l. W tym samym czasie T obiekt A 
przy realizacji swojej strategii chodowej będzie 
przebywał drogę s = 21. Długości dróg przebytych 
przez obiekty w czasie T wynikają z porównania 
wektorów. Zakładając, że grę rozpoczyna gracz B, 
można narysować dendryt gry, ilustrujący wszystkie 
możliwe warianty rozegrania pościgu przez A 
i ucieczki przez B. Fragment tego dendrytu przed¬ 
stawiono na ryc. 3. Gdy w sytuacji początkowej gry, 
określonej wierzchołkiem B\ dendrytu, obiekt B wy¬ 
kona strategię chodową z u to po czasie T znajdzie 
się w punkcie E x siatki z ryc. 2, a sytuacja powstała 
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w grze będzie określona wierzchołkiem A\ dendrytm 
W momencie, gdy obiekt B znajdzie się w punkcie E tf 
rozpoczyna pościg obiekt A, wybierając i realizując 
jedną ze swoich strategii chodowych. Załóżmy, że 



strategią chodową wybraną przez A jest strategia y x . 
Obiekt A wykonując tę strategię po czasie T znajdzie 
się w punkcie H x . W tym samym czasie, w którym 
obiekt A wykonuje swój pierwszy ruch, obiekt B, 
ze względu na ciągłość procesu, realizuje swój drugi 
ruch. Po czasie 2 T od momentu rozpoczęcia gry, 
obiekty — zgodnie z regułami prowadzenia gry 
wielochodowej — powinny się znajdować w punk¬ 
tach: H x dla A i E x dla B. W rzeczywistości obiekt B 
po pierwszym posunięciu w grze nie będzie w punkcie 
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■E u lecz w innym już punkcie, tj. w punkcie E 2 , 
tak jak to wynika z ryc. 2. Istnieje więc pewne prze¬ 
sunięcie czasowe w przebiegu gry, tzn. gdy gracz A 
realizuje ruch w pierwszym posunięciu, gracz B 
wykonuje już ruch w drugim posunięciu. Po każdym 
posunięciu w grze gracz A sprawdza,, czy spełniony 
jest warunek zakończenia gry s < t. Po pierwszym 
posunięciu warunek ten nie jest spełniony, sytuacja 
określona jest wierzchołkiem B\ dendrytu i gracz A 
na podstawie informacji o aktualnym położeniu 
obiektu B wykonuje swój drugi ruch. 

Na ryc. 2 pokazano linią pogrubioną przykładowy 
wariant tej gry, dotyczący przypadku, gdy po sześciu 
posunięciach w grze położenia obiektów A i B po¬ 
winny się pokrywać, oczywiście zgodnie z regułami 
prowadzenia gry wielochodowej. Punkt wzajemnego 
pokrycia oznaczony jest symbolami E 6 i H 6 . Ponie¬ 
waż ruch obiektu B jest ciągły, położenie obiektu B 
w punkcie E 6 , po sześciu posunięciach liczonych 
przez gracza A, jest pozorne, gdyż w rzeczywistości 
będzie się on znajdował w którymś z sąsiednich 
węzłów siatki. Warunek zakończenia gry, zostanie 
jednak spełniony, gdyż dla sąsiednich węzłów siatki, 
leżących na drodze przemieszczania się obiektów, 
spełniona jest równość s — l. 

Rozpatrywana gra na pierwszy rzut oka wydaje się 
trywialna, ponieważ z warunku V A = 2V B należy 
sądzić, że obiekt B zostanie zawsze przechwycony, 
o ile tylko gracz A postępować będzie rozumnie. 
W rzeczywistości tak nie jest, o czym świadczą trajek¬ 
torie ruchów obiektów pokazane na ryc. 2 linią 
przerywaną przy tych samych punktach początko¬ 
wych H 0 i E 0 . Przy przyjętych w grze prostoliniowych 
strategiach chodowych gracza A, gracz B ma możli¬ 
wość określenia takiego ciągu swoich strategii cho¬ 
dowych, przy którym nigdy nie będzie spełniony 
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warunek s < l. Gdy natomiast przyjąć dla gracza A 
taki układ strategii chodowych, jak to pokazano 
na ryc. 4, gracz A miałby zawsze możliwość 
przechwycenia obiektu B przy 
zachowaniu warunku s < 1. 

Scharakteryzowana wyżej gra 
ma wielkie znaczenie, gdyż za¬ 
poznaje nas z całą klasą gier wie- 
lochodowych opisujących pro¬ 
cesy pościgu i zbliżania, które 
objęte problematyką cyberne¬ 
tyki technicznej w epoce lotów 
kosmicznych nabierają coraz 
większego znaczenia. 
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Ryc. 4 


Gry z niepełną informacją 

Z poprzedniego punktu wynika, że w grze 
wielochodowej z pełną informacją gracze zawsze 
wiedzą, w którym wierzchołku dendrytu znajduje 
się aktualnie powstała w grze sytuacja, tzn. mają 
kompletną informację o sytuacji. Jeżeli natomiast 
w grze wielochodowej choć jeden z graczy nie będzie 
mógł określić jednoznacznie sytuacji, która powstała 
w procesie realizacji gry, grę taką zaliczymy do gier 
z niepełną informacją. 

Przyczyną tego, że gracz nie jest w stanie określić 
powstałej sytuacji najczęściej jest to, iż nie zna on 
poprzedzających tę sytuację ruchów swego prze¬ 
ciwnika, a ściśle mówiąc — wyborów dokonywa¬ 
nych w tych ruchach. Gra wielochodowa może cha¬ 
rakteryzować się jednostronnym lub dwustronnym 
brakiem informacji. Oznacza to, że dla jednego 
z graczy gra może być z niepełną informacją, a dla 
drugiego gracza — z pełną informacją. Jeżeli np. 
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w grze „Samochód policyjny” uciekająca grupa 
przestępców nie będzie znała kolejnych położeń 
samochodu policyjnego, proces ucieczki będzie dla 
nich — tzn. dla gracza B — grą z niepełną informacją, 
pomimo że sam proces pościgu dla gracza A będzie 
w dalszym ciągu grą z pełną informacją. 

Gra wielochodowa z niepełną infprmacją, podob¬ 
nie jak gra z pełną informacją, również ma swój 
dendryt, jednakże w dendrycie tym wprowadza się 
dodatkowe oznaczenia związane z brakiem infor¬ 
macji. Przykład początkowego fragmentu dendrytu 
gry z niepełną informacją przedstawiony został 
na ryc. 5. Jak wiadomo, wierzchołki dendrytu 
określają sobą możliwe do powstania sytuacje w grze. 
W dendrycie gry z niepełną informacją te wierz¬ 
chołki, które reprezentują sytuacje nierozróinialne 
dla gracza w danym posunięciu, objęte są linią prze¬ 
rywaną tak, jak to pokazano na ryc. 5. Linia prze¬ 



rywana oznacza po prostu, że na podstawie reguł 
gry gracz nie może powiedzieć, w którym spośród 
otoczonych tą linią wierzchołków się znajduje. 
Wierzchołki objęte linią przerywaną tworzą zbiór 
informacyjny. W dendrycie na ryc. 5 takim zbiorem 
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informacyjnym jest zbiór złożony z wierzchołków 
A\ i A i, przy czym jest to zbiór dwuelementowy. 
Jeżeli w dendrycie gry istnieje choć jeden zbiór 
informacyjny składający się co najmniej z dwóch 
wierzchołków, dendryt taki zawsze reprezentuje grę 
z niepełną informacją. Natomiast w przypadku, 
gdy w dendrycie występują wyłącznie zbiory infor¬ 
macyjne jednoełementowe, dendryt taki przedstawia 
grę z pełną informacją (por. ryc. 1). 

Aby lepiej zrozumieć znaczenie zbiorów infor¬ 
macyjnych w dendrycie gry z niepełną informacją, 
prześledźmy przebieg takiej gry według dendrytu 
z ryc. 5. Wierzchołkiem początkowym dendrytu 
jest wierzchołek B\ — wierzchołek ten stanowi jedno- 
elementowy zbiór informacyjny. W sytuacji okreś¬ 
lonej wierzchołkiem B\ rozpoczynający grę gracz B 
ma do wyboru strategię chodową z y lub z 2 . W za¬ 
leżności od wyboru dokonanego przez gracza B 
w pierwszym jego ruchu sytuacja znajdzie się 
w wierzchołku A\ lub A\. Wierzchołki te, jak już 
wiadomo, tworzą zbiór informacyjny. Oznacza to, 
że sytuacje A\ i A\ są nierozróżnialne dla gracza A , 
mianowicie nie jest on zorientowany, w którym 
wierzchołku dendrytu znajduje się powstała sytu¬ 
acja, gdyż nie wie on czy gracz B w swym pierwszym 
ruchu wykonał strategię chodową z y czy też z 2 . Jeżeli 
w pierwszym posunięciu gracz B wykonał strategię 
chodową z u a gracz A strategię chodową y u to po 
pierwszym posunięciu gra znajdzie się w wierzchołku 
B\. Ponieważ wierzchołek B\ wraz z wierzchołkami 
B\ i B\ objęte są jednym zbiorem informacyjnym, 
tym razem gracz B nie będzie wiedział, w którym 
rzeczywiście wierzchołku dendrytu znajduje się po¬ 
wstała sytuacja. Oczywiście gracz B może pocieszyć 
się tym, że gracz A również w dalszym ciągu nie wie, 
którym wierzchołkiem dendrytu jest określona po- 
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wstała sytuacja. Powyższy przypadek zachodzi pod 
warunkiem, że żaden z graczy nie zna wyborów 
swego przeciwnika. Jeżeli natomiast w pierwszym 
posunięciu gracz B wykona strategię chodową z 2 , 
a gracz A strategię chodową y l5 to sytuacja po pier¬ 
wszym posunięciu określona będzie wierzchołkiem 
B\. Ponieważ wierzchołek B\ sam tworzy zbiór in¬ 
formacyjny, gracz B posiada pełną informację o ruchu 
swego przeciwnika, a tym samym wie, że sytuacja 
w grze określona jest wierzchołkiem B\. 

Dla zbiorów informacyjnych charakterystyczny 
jest pewien warunek konieczny, który powinny one 
spełniać. Mianowicie: liczba krawędzi wychodzących 
z każdego z wierzchołków przynależnych do jednego 
zbioru informacyjnego powinna być jednakowa dla 
wszystkich wierzchołków tego zbioru, przy czym 
każda krawędź wychodząca z dowolnego takiego 
wierzchołka powinna mieć swój odpowiednik w kra¬ 
wędziach wychodzących z pozostałych wierzchołków 
danego zbioru informacyjnego. Dla zbiorów A\, A\ 
i B\, B\, B\ z ryc. 5 warunek ten jest w pełni speł¬ 
niony. 

Dla dendrytu gry z niepełną informacją możemy 

— podobnie jak w przypadku gry z pełną informacją 

— określić wszystkie możliwe strategie pełne graczy. 
Znając te strategie możemy przejść do postaci nor¬ 
malnej gry, tzn. możemy ułożyć macierz gry. Roz¬ 
wiązując taką grę na podstawie macierzy gry okreś¬ 
limy optymalne strategie gracza. Otóż tutaj okazuje 
się, że gra wielochodowa z niepełną informacją może 
nie mieć punktu siodłowego w obszarze strategii 
czystych, w odróżnieniu od gier z pełną informacją, 
które zawsze ten punkt mają. Gra wielochodowa 
z niepełną informapją może mieć tylko rozwiązanie 
w obszarze strategii mieszanych. Stąd też gdy gra 
taka opisuje proces jednorazowy, a gracze chcą 



zastosować swoje optymalne strategie mieszane, 
wówczas optymalność stosowanych przez nich stra¬ 
tegii chodowych będzie obarczona pewnym prawdo¬ 
podobieństwem. 

Gry wielochodowe z niepełną informacją są jeszcze 
w niedostatecznym stopniu opracowane w teorii 
gier, pomimo że spotykamy się z nimi bardzo często 
w różnych procesach i problemach decyzyjnych. 
W niniejszej książce ograniczymy się wyłącznie do 
gier wielochodowych z pełną informacją. 


Gry z naturą 

Dotychczas rozpatrywaliśmy tylko takie gry, 
w których interesy graczy są sobie przeciwstawne. 
W grach tych każdy z graczy zainteresowany jest 
wynikiem gry i w zależności od charakteru gry dąży 
do maksymalizacji lub minimalizacji wyniku. Obok 
tych gier istnieje niezmiernie ważna klasa gier dwu¬ 
osobowych, w których charakterystyczne jest to, 
że jeden z graczy nie jest zainteresowany wynikiem 
gry. W ogólnym przypadku graczem nie zaintereso¬ 
wanym wynikiem gry jest natura. Stąd też gry, 
w których z jednej strony występuje gracz dążący 
do ściśle określonego celu — niekoniecznie nawet 
gracz rozumny — a z drugiej strony występuje na¬ 
tura, nazywamy grami z naturą lub też grami prze¬ 
ciw naturze. Zarówno postępowanie najdrobniej¬ 
szego żywego organizmu w przyrodzie w odwiecznej 
walce o byt i zachowanie gatunku, jak i każde ro¬ 
zumne oddziaływanie człowieka na określone zja¬ 
wiska w otaczającym go świecie można potraktować 
jako grę z naturą. Z tego też powodu gry z naturą 
stanowią najliczniejszą grupę gier. Jest po prostu 
rzeczą niemożliwą wyliczenie wszystkich przypadków 
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gier z naturą z powodu olbrzymiej skali rozpiętości 
między różnymi typami tych gier. Granice tej skali 
są mało uchwytne, gdyż i postępowanie mrówki 
w drodze do mrowiska, i działanie automatu na 
powierzchni nieznanej planety można opisać bardzo 
podobnymi do siebie modelami gry z naturą. 

Ponieważ większość procesów sterowania można 
opisać matematycznym modelem gry dwuosobowej 
z naturą, gry te odgrywają szczególnie ważną rolę 
w cybernetyce, a poprzez nią mają wpływ na rozwój 
innych nauk. Niestety gry te stanowią jeszcze prawie 
„białą plamę” w teorii gier; są w niedostatec zn ym 
stopniu poznane, co przy ogromnych możliwościach 
zastosowania tych gier jest zjawiskiem z pewnością 
bardzo niekorzystnym. 

Rozpatrzmy teraz pewne właściwości gry z naturą. 
Pod pojęciem natury rozumie się w teorii gier gracza, 
który nie jest zainteresowany wielkością swojej wy¬ 
granej lub przegranej, a tym samym nie postępuje 
zgodnie ze swoją strategią optymalną. Przeciwnikiem 
natury jest gracz dążący do uzyskania jak najwięk¬ 
szej wygranej. Dalej będziemy zakładać, że przeciw¬ 
nikiem natury jest gracz rozumny i oznaczać go bę¬ 
dziemy symbolem A, natomiast naturę jako gracza 
oznaczać będziemy symbolem B. Ponieważ tendencje 
natury jako gracza B nie są przeciwstawne tenden¬ 
cjom gracza A, gra z naturą jest z zasady grą bez 
sumy zerowej. 

Jednakże teoria gier, w sensie podanym przez 
von Neumanna, zakłada najbardziej ostrożną strategię 
postępowania graczy, która zapewnia im co prawda 
minimalną wygraną, lecz za to bez ryzyka. Stąd też 
gracz A prowadząc grę z naturą B powinien postę¬ 
pować możliwie najostrożniej, a więc — nie chcąc 
ryzykować — powinien liczyć się z możliwie najmniej 
sprzyjającą dla siebie grą partnera B, czyli przypisać 
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mu tendencje przeciwstawne do swoich. W wyniku 
takiego podejścia gra z naturą zostaje sprowadzona 
do gry wyraźnie antagonistycznej, a przez to sarno 
do gry z sumą zerową. Uogólniając to rozumowanie 
można powiedzieć, że każda gra z naturą, w sensie 
teorii von Neumanna, powinna być potraktowana 
przez przeciwnika natury jako gra z sumą zerową. 

Jednoznaczne podejście do gry, które — zgodnie 
z teorią von Neumanna — nakazuje postępować 
graczowi z największą ostrożnością, a tym samym 
każe traktować przeciwnika jako idealnego mistrza, 
skrytykowane zostało przez Norberta Wienera 
w uzupełnionym wydaniu jego książki Cybernetyka 
czyli sterowanie i komunikacja w zwierzęciu i maszynie. 
Wiener uzasadnił swoją krytykę tym, że bardzo 
często zachodzi konieczność pominięcia ostrożnego 
postępowania i stosowanie ryzyka, przy czym linia 
postępowania powinna opierać się na pewnych da¬ 
nych statystycznych dotyczących rozpatrywanego 
procesu opisanego grą. 

Obecnie w teorii gier istnieją dwie metody podej¬ 
ścia do gier z naturą. Jedna z tych metod, oparta na 
teorii von Neumanna, wyklucza stosowanie ryzyka, 
a druga z tych metod uwypukla znaczenie ryzyka 
w procesie prowadzenia gry i pozwala na jego sto¬ 
sowanie. Wybór jednej lub drugiej metody podykto¬ 
wany jest charakterem gry i zasobem informacji 
o postępowaniu natury. Drugą metodę stosuje się 
w zasadzie tylko wtedy, gdy na podstawie danych 
statystycznych znane są prawdopodobieństwa sto¬ 
sowanych przez naturę strategii. W takim przypadku 
gracz A będzie brał pod uwagę tylko te strategie 
natury, które występują z dużym prawdopodobień¬ 
stwem. Oczywiście nie zawsze rozkład prawdo¬ 
podobieństw strategii natury jest znany, przy czym, 
biorąc pod uwagę również i to, że nie zawsze wolno 



nam ryzykować, wydaje się, że minimaksowa teoria 
von Neumanna jest dominująca w teorii gier wów¬ 
czas, gdy rozpatrujemy gry z naturą. 

Należy zwrócić uwagę, że większość gier z naturą 
opisuje procesy wieloetapowe, należy więc do gier 
wielochodowych wyrażanych graficznie przy pomocy 
dendrytu. Postać ekstensywna gier znacznie ułatwia 
analizę konkretnych gier z natmą. Dzięki istnSu 
etapów w grze z naturą, gracz A ma możliwość mo¬ 
dyfikowania stosowanych przez siebie strategii cho- 

* i w grze wielochodowej natura nie 

jest zainteresowana wysokością wygranej i swoje 
strategie chodowe stosuje w sposób losowy DODeł- 
nia błędy w procesie realizacji gry. Błędne może 
wykorzystać gracz A w celu powiększenia swojej 
wygranej. Narzuca się więc wniosek, że gracz A nie 
potrzebuje znać swojej pełnej strategii optymalnej, 
gdyż chcąc maksymalizować swą wygraną musi 
zrezygnować ze stosowania w grze tej właśnie stra¬ 
tegii. Stąd też gracz A, na podstawie analizy dendrytu 
BFy> powinien zebrać takie dane, które umożliwiałyby 
mu prowadzenie gry z wykorzystywaniem błędów 
popełnianych przez gracza B. Z tych też względów 
dla każdej sytuacji powstałej w grze wielochodowej 
z naturą gracz A powinien mieć już z góry przygo¬ 
towaną odpowiednią, optymalną strategię chodową, 
która w wyniku następnych ruchów — zapewni 
mu uzyskanie najwyższej wygranej. Prowadzi to do 
jednostronnej optymalizacji dendrytu gry, która 
zostanie omówiona w następnym punkcie. 


Metoda rozwiązywania gier wielochodowych 

Podstawowym celem teorii gier jest opraco¬ 
wanie wskazówek do racjonalnego, optymalnego 
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postępowania dla każdej ze stron występujących 
w procesie opisanym modelem gry. Opracowanie 
takich wskazówek najczęściej jest sprowadzane do 
znalezienia rozwiązania gry przez określenie optymal¬ 
nych strategii graczy oraz do wskazania minimakso- 
wej wartości gry. Rozwiązanie gry polegające na 
wyznaczeniu optymalnych strategii graczy jest nie 
zawsze możliwe i nie zawsze przydatne, ponieważ 
większość konkretnych gier ma postać wielochodową 
i reprezentuje procesy wieloetapowe. Przebieg takich 
procesów -wymaga bardzo często ciągłej modyfikacji 
strategii postępowania danego gracza w trakcie 
procesu reprezentującego grę wielochodową. Mo¬ 
dyfikacji takiej nie zapewnia optymalna strategia 
pełna. Ponadto, aby rozwiązać grę, należy ją spro¬ 
wadzić do postaci normalnej, tzn. należy ułożyć 
macierz gry. Jest to możliwe tylko dla bardzo pro¬ 
stych gier wielochodowych, w których każdy z graczy 
dysponuje niewielką liczbą strategii pełnych. 

Dla większości gier wielochodowych — a ściśle 
mówiąc, dla procesów dających się opisać modelem 
gry wielochodowej — liczba strategii pełnych graczy 
jest tak olbrzymia, że uniemożliwia wprost ułożenie 
macierzy gry, a przez to samo rozwiązanie gry. 
Do trudności związanych z ułożeniem macierzy 
gry należy zaliczyć również i to, że samo określenie 
wszystkich strategii pełnych graczy jest bardzo 
często zadaniem nie do wykonania, nawet przy 
użyciu najbardziej nowoczesnych maszyn cyfrowych. 
Przykładem jest gra w szachy, dla której nie można 
jeszcze dotychczas wyznaczyć wszystkich optymalnych 
strategii pełnych graczy, pomimo że liczba tych 
strategii jest znana. 

Załóżmy teraz, że pozbyliśmy się trudności związa¬ 
nych z ułożeniem macierzy gry, lub lepiej, że zawsze 
istnieją możliwości przejścia z postaci wielochodo- 
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wej gry na postać normalną i znalezienia rozwiąza¬ 
nia. Znając rozwiązanie nie zawsze będziemy mogli 
z niego korzystać w procesie realizacji gry wielo- 
chodowej, co wynika z tego, że rozwiązując grę 
w okresie poprzedzającym jej realizację zakładamy 
najbardziej niekorzystny przypadek postępowania 
przeciwnika na wszystkich etapach gry. W rzeczy¬ 
wistości nasz przeciwnik może się nie trzymać swojej 
optymalnej strategii pełnej i może popełniać błędy 
w procesie realizacji gry. Błędy te powinniśmy wy¬ 
korzystać w celu podwyższenia swej wygranej, a więc 
powinniśmy zarzucić postępowanie według opty¬ 
malnej strategii pełnej, gdyż w trakcie realizacji gry 
dojdziemy do przekonania, że w wyniku zastoso¬ 
wania jakiejś innej strategii pełnej nasza wygrana 
byłaby znacznie wyższa. Ponadto należy zwrócić 
uwagę, że większość procesów opisywanych mode¬ 
lem gry wielochodowej należy do klasy gier z naturą. 
Natura, jak już wiemy, nie jest zainteresowana wy¬ 
nikiem gry, nie trzyma się swojej optymalnej strategii 
pełnej, gdyż swoje strategie chodowe wybiera losowo, 
a więc popełnia — z punktu widzenia gracza rozum¬ 
nego — niedopuszczalne błędy. 

Utwierdza to nas w przekonaniu, że rozwiązanie 
gry wielochodowej przez sprowadzenie jej do postaci 
normalnej i określenie optymalnych strategii pełnych 
obu graczy jest w ogólnym przypadku w praktyce 
mało przydatne. 

Jakie więc powinno być racjonalne działanie każ¬ 
dego z graczy w grze wielochodowej, aby zapewniło 
mu możliwie największą wygraną i było działaniem 
optymalnym bez względu na to czy jego przeciwnik 
popełnia błędy, czy też gra rozumnie? Otóż sposób 
optymalnego postępowania gracza w grze wielo¬ 
chodowej z pełną informacją podyktowany jest 
specyfiką prowadzenia gry wielochodowej, a miano- 
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wicie tym, że na każdym etapie gry przy wyborze 
strategii chodowej gracz powinien uwzględnić wpływ 
dokonanego wyboru na dalszy przebieg gry. Zmu¬ 
szony jest więc on przeanalizować wszystkie możliwe 
sytuacje, które mogą powstać w wyniku działania 
jego przeciwnika w następnych posunięciach i do¬ 
piero potem określić, czy dokonywany przez niego 
wybór jest dla niego optymalny. Jeżeli gracz nie prze¬ 
prowadzi takiej analizy, to wybrana przez niego 
strategia chodowa — na pozór optymalna na danym 
etapie gry — może doprowadzić w ostatecznym 
wyniku do przegranej. Analiza taka w ogólnym 
przypadku jest bardzo złożona i należy ją prze¬ 
prowadzić na podstawie dendrytu gry. Jak wiadomo, 
sytuacja powstała w grze jest jednoznacznie określona 
jednym z wierzchołków dendrytu, natomiast kra¬ 
wędzie wychodzące z tego wierzchołka reprezentują 
strategie chodowe tego gracza, na którego przypada 
ruch w tej właśnie sytuacji. Z kolei na każdej krawędzi, 
z wyjątkiem krawędzi ostatniego piętra dendrytu, 
jest zbudowany jak gdyby oddzielny dendryt, nazy¬ 
wany dendrytem składowym przyporządkowanym 
danej krawędzi. Aby stwierdzić czy wybierana 
w danej sytuacji strategia chodowa jest korzystna 
dla danego gracza, należy przeanalizować dendryt 
składowy przyporządkowany krawędzi opisanej tą 
strategią. Z wierzchołka dendrytu wychodzi na ogół 
kilka krawędzi, należy więc rozpatrzyć wszystkie 
krawędzie, stąd też liczba dendrytów składowych 
podlegających analizie jest taka sama, jak liczba 
krawędzi wychodzących z danego wierzchołka. Po 
przeprowadzeniu analizy wyboru strategii chodowej 
wyniki jej należy porównać i wybrać tylko jedną 
krawędź, najbardziej korzystną dla analizowanego 
wierzchołka dendrytu, natomiast pozostałe krawędzie 
— a tym samym przyporządkowane im dendryty 
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składowe — można z dendrytu gry wykreślić. W re¬ 
zultacie dochodzimy do wniosku, że z punktu widze¬ 
nia interesów danego gracza, po przeprowadzonej 
analizie całego dendrytu, z każdego wierzchołka 
opisanego symbolem tego gracza powinna wycho¬ 
dzić tylko jedna krawędź, i to taka*' która reprezen¬ 
tuje optymalną dla danej sytuacji strategię chodową. 
Stąd też jeżeli chcemy np. określić optymalne po¬ 
stępowanie gracza A, to każdemu wierzchołkowi 
A\ dendrytu gry należy przyporządkować nie zbiór 
krawędzi, a tylko jedną krawędź opisaną taką stra¬ 
tegią chodową, która po uwzględnieniu wszystkich 
następnych posunięć zagwarantuje graczowi A uzys¬ 
kanie możliwie największej wygranej. Podobne rozu¬ 
mowanie można przeprowadzić również z punktu 
widzenia interesów gracza B. 

Uwzględniwszy przeprowadzone wyżej rozważa¬ 
nia można powiedzieć, że określenie optymalnego 
postępowania danego gracza w grze wielochodowej 
sprowadza się do jedostronnej optymali¬ 
zacji dendrytu gry na korzyść danego 
gracza. Pod tym pojęciem rozumiemy proces wy¬ 
kreślenia z dendrytu niekorzystnych dla danego 
gracza jego strategii chodowych, a ściśle mówiąc 
krawędzi opisanych tymi strategiami. Jednostronną 
optymalizację dendrytu gry wykonuje się na korzyść 
jednego lub drugiego gracza. W trakcie jednostronnej 
optymalizacji dendrytu gry następuje redukcja den¬ 
drytu, tzn. zmniejszenie jego rozmiarów w wyniku 
wykreślenia niekorzystnych dla danego gracza kra¬ 
wędzi i zbudowanych na tych krawędziach dendry- 
tów składowych. 

Aby lepiej zrozumieć jednostronną optymalizację 
dendrytu gry, powróćmy do przykładu z krasno¬ 
ludkami, które wycieczkę po gałęziach jabłoni po¬ 
traktowały jako pewnego rodzaju grę. Przypom- 
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nijmy, że celem tej gry dla krasnoludka czarnego, 
reprezentującego gracza A, jest dojście do punktu 
jabłoni, w którym znajduje się możliwie największe 
jabłko. Natomiast celem gry dla krasnoludka białego 
— będącego graczem B i rozpoczynającego grę — 
jest doprowadzenie do tego, aby wygrana gracza A 
była jak najmniejsza. Gdy pewnego dnia krasno¬ 
ludek biały zaproponował czarnemu powtórzenie 
wycieczki na tych samych zasadach, krasnoludek 
czarny postanowił ułatwić sobie grę. W tym też celu 
przeanalizował wszystkie możliwe dla siebie kie¬ 
runki marszrut wzdłuż gałęzi jabłoni. Następnie 
poprosił kolegów o pomoc w obcinaniu niekorzy¬ 
stnych dla siebie gałęzi jabłoni. 

Aby krasnoludek biały nie miał zastrzeżeń co do 
tego, iż w wyniku przerzedzenia korony jabłoni 
zostały zmniejszone jego szanse jako gracza B, 
krasnoludek czarny kazał poobcinać niekorzystne 
dla siebie gałęzie tylko przy tych rozgałęzieniach, 
w których on, jako gracz A, wybiera kierunek marsz¬ 
ruty. Po przeprowadzonej naradzie czarne krasnoludki 
doszły do wniosku, że w celu zmniejszenia nakładu 
pracy nie potrzeba obcinać gałęzi we wszystkich 
tego typu rozgałęzieniach, lecz tylko w niektórych. 
Czy słuszna była decyzja czarnych krasnoludków 
dotycząca zmniejszenia nakładu pracy? — można 
się nad tym zastanowić. 

W wyniku wykonanej przez czarne krasnoludki 
pracy przerzedzona korona drzewa jabłoni charak¬ 
teryzowała się tym, że z każdego rozgałęzienia, 
w którym na gracza A przypadł obowiązek wyzna¬ 
czenia kierunku marszruty, wychodziła tylko jedna 
gałąź. W ten sposób gracz A miał już z góry narzu¬ 
cony kierunek swego postępowania, eliminujący 
koniejczność wyboru decyzji w trakcie prowadzenia 
gry, tj. w trakcie „wycieczki”. Wszystkie powyższe 
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czynności, wykonane przez gracza A w celu wyelimi¬ 
nowania niekorzystnych dla siebie gałęzi w drzewie, 
składają się na proces jednostronnej optymalizacji 
dendrytu gry. 

Jednostronna optymalizacja dendrytu gry jest na 
ogół procesem dość złożonym. E)la przykładu 
omówimy jednostronną optymalizację dendrytu gry 
na korzyść gracza A dla dendrytu przedstawionego 
na ryc. 6 (otrzymanego z ryc. 1 po wprowadzeniu 
dodatkowych symboli). 



Jednostronną optymalizację dendrytu gry naj¬ 
łatwiej przeprowadzić rozpoczynając analizę den¬ 
drytu od pierwszego z prawej strony wierzchołka 
ostatniego piętra dendrytu. Dla dendrytu gry z ryc. 6 
wierzchołek ten jest oznaczony symbolem A\. 
Z wierzchołka A\ wychodzą krawędzie y t i y 2 , które 
reprezentują strategie chodowe gracza A. Jeżeli 
w sytuacji A\ gracz A wybiera strategię chodową y u 
to wówczas przegrywa 9 punktów, co wynika z opisu 
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końcowego wierzchołka dendrytu, do którego do¬ 
prowadza krawędź >' x . Jeżeli natomiast gracz A 
wybierze strategię y 2 , to wygrywa 9 punktów. Oczy¬ 
wiste jest, że strategia chodowa y x jest niekorzystna 
dla gracza A i jako taka podlega wykreśleniu z den¬ 
drytu. Następnym podlegającym analizie wierz¬ 
chołkiem jest wierzchołek A\. Wychodzące z tego 
wierzchołka krawędzie y r i y 2 doprowadzają odpo¬ 
wiednio do wyników końcowych 15 i 14. W sytuacji 
A\ strategia chodowa jest dla gracza A bardziej 
korzystna niż strategia chodowa y 2 , gdyż zapewnia 
mu większą wygraną, dlatego też krawędź y 2 podlega 
wykreśleniu z dendrytu. Jak widać na ryc. 6, wierz¬ 
chołki A\ i A\ wchodzą w skład dendrytu składo¬ 
wego C x . Korzeniem tego dendrytu jest wierzchołek 
B\ — przy wierzchołku tym zapisujemy wyniki 
końcowe gry, które gracz A ma zagwarantowane po 
znalezieniu się w sytuacji w wierzchołku B\. Po prze¬ 
prowadzonej jednostronnej optymalizacji dendrytu Ci 
wyniki te określone są parą liczb (9, 15). 

Kontynuując naszą analizę dochodzimy do wierz¬ 
chołka A\ dendrytu. Z wierzchołka tego wychodzą 
dwie krawędzie opisane strategiami chodowymi y t 
i y 2 . Strategia chodowa y x doprowadza do wierz¬ 
chołka B 1 i gwarantuje graczowi A wygraną 9 lub 
15 punktów. Natomiast o zaletach strategii chodowej 
y 2 nie można na razie nic powiedzieć, gdyż przy¬ 
porządkowany krawędzi y 2 dendryt składowy C 2 
nie został jeszcze przeanalizowany. W dendrycie C 2 
znajdują się wierzchołki A\ i A\. Analizując sytuację 
określoną wierzchołkiem A\ dojdziemy do wniosku, 
że z dwóch krawędzi y t i y 2 wychodzących z tego 
wierzchołka krawędź y x jest bardziej korzystna dla 
gracza A niż krawędź y 2 . Stąd też krawędź y 2 podlega 
wykreśleniu z dendrytu. Gorzej jest z oszacowaniem 
krawędzi wychodzących z wierzchołka A\, gdyż 
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w tym przypadku strategie chodowe y t i y 2 dopro¬ 
wadzają do jednakowej przegranej gracza A, Zgodnie 
z zasadą jednostronnej optymalizacji dendrytu przy 
wierzchołku A\ pozostawiamy tylko jedną krawędź, 
na przykład y x . Po jednostronnej optymalizacji den¬ 
drytu C 2 wierzchołki końcowe tego dendrytu będą 
opisane: liczbą 10 dla krawędzi wychodzącej z wierz¬ 
chołka A% i liczbą —6 dla krawędzi wychodzącej 
z wierzchołka A\. Liczby te zapisujemy przy wierz¬ 
chołku B 2 , będącym korzeniem dendrytu C 2 . Z za¬ 
pisu tego wynika, że jeżeli gra znajdzie się w wierz¬ 
chołku B\, to gracz A musi liczyć się z tym, że może 
przegrać 6 punktów. Gracz A nie powinien więc 
dopuścić do powstania sytuacji określonej wierz¬ 
chołkiem B\. Stąd też spośród dwóch strategii 
chodowych y x i y 2 , opisujących krawędzie wycho¬ 
dzące z wierzchołka A\, gracz A powinien zawsze 
wybrać strategię chodową y t — a więc krawędź y 2 
podlega wykreśleniu z dendrytu. Wraz z wykreśle¬ 
niem krawędzi y 2 wykreślony zostanie dendryt 
składowy C 2 . W analogiczny sposób przeprowadza 
się jednostronną optymalizację dendrytów składo¬ 
wych C 3 i C 4 . Jej wynikiem będzie przyporządko¬ 
wanie wierzchołkowi B\ pary liczb (1, 0), a wierz¬ 
chołkowi B\ pary liczb (6, —5). Dendryt składowy C 3 
jest więc bardziej korzystny dla gracza A niż den¬ 
dryt C 4 . Stąd też dendryt składowy C 4 jako mniej 
korzystny wraz z doprowadzającą do niego krawę¬ 
dzią y 2 podlega wykreśleniu z dendrytu gry. Końco¬ 
wym rezultatem omówionego procesu jest jedno¬ 
stronnie zoptymalizowany dendryt gry, który przed¬ 
stawiony został na ryc. 7. Dendryt ten odzwierciedla 
optymalne postępowanie gracza A wobec stoso¬ 
wanych przez gracza B strategii chodowych. Zawiera 
znacznie mniejszą liczbę wierzchołków, i krawędzi 
niż dendryt gry przed optymalizacją, co łatwo stwier- 
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dzić porównując ryciny 6 i 7. Dla ułatwienia tego 
porównania obok ryc. 7 została przedstawiona ta¬ 
bela, umożliwiająca identyfikację wierzchołków 
dendrytu z ryc. 7 z wierzchołkami dendrytu z ryc. 6. 
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Scharakteryzujemy teraz jednostronną optymalizację 
dendrytu gry na korzyść gracza B, który dla dendrytu 
z ryc. 6 pierwszy rozpoczyna grę. W tym przypadku 
analizę dendrytu gry przeprowadza się, opierając 
na wierzchołkach typu 5*". Pierwszym wierzchołkiem 
podlegającym analizie jest wierzchołek B\, będący ko¬ 
rzeniem dendrytu C t . Z wierzchołka tego wychodzą 
dwie krawędzie opisane strategiami chodowymi z l 
i z 2 gracza B. Oceniając te dwie strategie gracz B 
musi wziąć pod uwagę najbardziej niekorzystne dla 
siebie postępowanie gracza A. Stąd też, gdy gracz B 
wybierze strategię chodową z u może przegrać 9 
punktów, natomiast gdy wybierze strategię chodową 
z 2 , może przegrać 15 punktów. W sytuacji określonej 
wierzchołkiem B\ strategia chodowa z t jest dla gracza 
B bardziej korzystna, gdyż gwarantuje mu mniejszą 
przegraną niż strategia chodowa z 2 . Krawędź z 2 



podlega więc wykreśleniu z dendrytu, a przy wierz¬ 
chołku B\ powinna być zapisana liczba 9 oznacza¬ 
jąca poziom bezpieczeństwa dla gracza B przy wy¬ 
borze strategii chodowej z t . Analizując w ten sam 
sposób pozostałe dendryty składowe C 2 , C 3 , Q 
i wykreślając z nich niekorzystne dla.,gracza B kra¬ 
wędzie, przy wierzchołkach B\, B\, B\ jako wynik 
analizy zapiszemy odpowiednio liczby —6, 0, —5. 
Liczby te określają jednoznacznie gwarantowane 
wartości wygranej gracza B w sytuacjach B\, B\, B\. 
Następnym etapem jednostronnej optymalizacji jest 
przesunięcie punktu analizy do wierzchołka B\. 
Z wierzchołka tego wychodzą dwie krawędzie opisane 
strategiami chodowymi z x i z 2 , w związku z czym 
należy określić, która z tych dwóch krawędzi jest 
bardziej korzystna dla gracza B. Krawędź opisana 
symbolem z x doprowadza do wierzchołka A\ dendry¬ 
tu. Ponieważ gracz B nie ma wpływu na działanie 
gracza A, musi się liczyć z tym, że w sytuacji A\ 
gracz A zastosuje najbardziej niekorzystną strategię 
chodową y u przy której przegrana gracza B może 
wynieść 9 punktów. Liczba 9 określa więc poziom 
bezpieczeństwa dla gracza B przy wyborze przez 
niego strategii chodowej z x opisującej pierwszą 
krawędź wychodzącą z wierzchołka B\. Przeprowa¬ 
dzając taką samą analizę dla drugiej krawędzi wy¬ 
chodzącej z wierzchołka B\ i opisanej strategią cho¬ 
dową z 2 , stwierdzamy, że przy wyborze tej strategii 
poziom bezpieczeństwa dla gracza B wynosi 0 punk¬ 
tów, tzn. gracz B ńic nie przegrywa. Stąd też wynika, 
że krawędź z 2 wychodząca z wierzchołka B\ jest 
bardziej korzystna niż krawędź z t . Krawędź z x 
przyporządkowana wierzchołkowi B\ jest ostatnią 
podlegającą wykreśleniu krawędzią dendrytu i przez 
jej wykreślenie kończy się proces jednostronnej 
optymalizacji dendrytu gry na korzyść gracza B. 
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Wynikiem końcowym tego procesu jest już jedno¬ 
stronnie zoptymalizowany dendryt gry. Dendryt 
ten — przedstawiony na ryc. 8 — odzwierciedla 
optymalne postępowanie gracza B w funkcji stoso¬ 
wanych przez gracza A strategii chodowych. 
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W dalszych naszych rozważaniach będziemy się 
interesować wyłącznie jednostronną optymalizacją 
dendrytu gry na korzyść gracza A, a gracza B bę¬ 
dziemy traktować najczęściej jako naturę. Kryteria 
jednostronnej optymalizacji dendrytu gry na ko¬ 
rzyść gracza A mogą być różne, w zależności od 
charakteru gry i struktury reprezentującego ją den¬ 
drytu. Można wyróżnić następujące rodzaje jedno¬ 
stronnej optymalizacji dendrytu gry: 

a) ze względu na maksymalną wartość wygranej, 

b) ze względu na minimalną liczbę posunięć w grze, 

c) ze względu na maksimum wygranej i minimum 
posunięć w grze. 

Inny możliwy podział jest uwarunkowany liczbą 
strategii pełnych, będących w dyspozycji każdego 
z graczy. Stąd też wyróżnia się jednostronną opty- 
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malizacęj dendrytu gry o małej liczbie strategii* 
którą można przeprowadzić odręcznie, oraz jedno¬ 
stronną optymalizację dendrytu gry o dużej liczbie 
strategii, do której przeprowadzenia należy wykorzy¬ 
stać maszynę cyfrową. Bez względu na zastosowane 
kryterium optymalizacji i sposób jej przeprowadze¬ 
nia, jednostronnie zoptymalizowany , dendryt gry 
przedstawia zawsze taki rodzaj gry, w której dany 
gracz ma z góry narzucone sobie optymalne stra¬ 
tegie postępowania i w grze nie dokonuje wyboru. 


Jednostronna optymalizacja dendrytu gry o dużej 
liczbie strategii 

Jednostronna optymalizacja dendrytu gry wielo- 
chodowej o dużej liczbie strategii jest procesem 
złożonym i może być dokonana tylko przy pomocy 
maszyny cyfrowej. Zanim przystąpimy do scharak¬ 
teryzowania tej optymalizacji, przedstawiony zostanie 
pewien analityczny opis struktury dendrytu przy 
użyciu odpowiednich zbiorów, zawierających ele¬ 
menty występujące w opisie krawędzi dendrytu. 
Odpowiednie opisanie struktury dendrytu bardzo 
ułatwia określenie przez maszynę cyfrową algorytmu 
jednostronnej optymalizacji dendrytu gry. 

Pojęcie algorytmu należy do podstawowych po¬ 
jęć w matematyce. Przez algorytm rozumie się do¬ 
kładny przepis wykonania w określonym porządku 
pewnego układu operacji w celu rozwiązania wszyst¬ 
kich zagadnień pewnego określonego typu. Naj¬ 
prostszymi algorytmami są przepisy, przy pomocy 
których wykonuje się to lub inne spośród czterech 
działań arytmetycznych w dziesiętnym systemie li¬ 
czenia, np. przepis dotyczący dzielenia liczb. Algo¬ 
rytmem możemy nazywać przepis dotyczący sposobu 
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rozwiązania dowolnie złożonego zadania matematy¬ 
cznego. Zastosowanie algorytmu prowadzi w skoń¬ 
czonej liczbie kroków (czynności) od danych wyj¬ 
ściowych do wyników końcowych. Z teoretycznego 
punktu widzenia nie jest istotne, czy dane wyjściowe 
i wyniki są liczbami; danymi i wynikami mogą być 
również dowolne inne symbole abstrakcyjne. Jeżeli 
dany problem lub dane zadanie matematyczne ma 
być rozwiązane przez maszynę cyfrową, to w treści 
przepisu rozwiązania tego problemu lub też zadania 
są uwzględniane pewne właściwości działania maszyny 
'Cyfrowej. W tym przypadku przepis taki nazwiemy 
algorytmem rozwiązania danego problemu na ma¬ 
szynie cyfrowej. Algorytm taki jest podstawą do 
opracowania programu już dla konkretnej maszyny 
cyfrowej, przeznaczonej do rozwiązania danego pro¬ 
blemu. 

Jak już wiadomo, zbiór strategii chodowych gra¬ 
cza B w grze wielochodowej jest określony postacią 
(p. wzór 3.2) 

Z — \Zi, Z 2 ' •••> Zj) •••> Zs} 

Elementy tego zbioru opisują krawędzie wycho¬ 
dzące z wierzchołków B£ dendrytu. W ogólnym przy¬ 
padku dendryt gry składa się z kilku pięter, a strategie 
chodowe opisujące krawędzie poszczególnych pięter 
mogą się znacznie między sobą różnić. Stąd też do¬ 
godnie jest podzielić zbiór Z na podzbiory strategii 
chodowych dopuszczalnych do wykorzystania w po¬ 
szczególnych piętrach dendrytu, tzn. dopuszczalnych 
w poszczególnych posunięciach w grze. Po dokonaniu 
takiego podziału zbiór Z przyjmie następującą postać 

_ (y 1 y2 yn ym\ /I 

■ 1__T ^ j2 J * * m J jŁ-/ j ł ł * J ■ J 

gdzie: n — numer piętra dendrytu, m — najwyższe 
piętro dendrytu. gry. 


91 



Dowolny element Z" tego zbioru jest jednocześnie 
jego podzbiorem zawierającym takie elementy Zj, 
tzn. takie strategie chodowe gracza B, które mogą 
wystąpić w «-tym posunięciu i opisują krawędzie 
n-tego piętra dendrytu. Podzbiór Z" <= Z jest więc 
zbiorem o postaci 

. s ł 

Z = {zj t , z j2 , ..., Zj r , ..., z^,} (3*4) 

gdzie indeksy j r są pewnymi liczbami całkowitymi 
przynależnymi do zbioru indeksów opisujących ele¬ 
menty Zj zbioru Z zadanego wyrażeniem (3.2). 

Z kolei zbiór Z" możemy również podzielić na 
pewne podzbiory uwarunkowane strukturą n-tego 
piętra dendrytu. Analizując dendryt gry łatwo za¬ 
uważyć, że elementy Zj opisujące krawędzie wycho¬ 
dzące z dowolnego wierzchołka B k ~ 1 dendrytu okreś¬ 
lają zbiór dopuszczalnych strategii chodowych gra¬ 
cza B w sytuacji określonej wierzchołkiem Ą? -1 . 
Zbiór taki oznaczymy symbolem S" i opiszemy na¬ 
stępująco 

ófc ^k2’ -- Zk'} (3*3) 

gdzie indeksy k s przynależne są do zbioru indeksów 
opisujących elementy zbioru Z". Uwzględniając 
wszystkie zbiory typu S£ w n-tym piętrze dendrytu, 
zbiór Z" można przedstawić jako następującą sumę 
zbiorów 


Z" = 5" U S n 2 U ... U S n kn U .:. U S?„ (3.6) 

gdzie /„ — maksymalna liczba wierzchołków B k ~ l 
znajdujących się na pierwszym poziomie n-tego 
piętra dendrytu. Dla orientacji, na ryc. 9 przedsta¬ 
wiono wykorzystanie zbiorów Ą" w opisie dendrytu 
gry przed optymalizacją. 
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Ryc. 9 


W analogiczny sposób możemy przeprowadzić 
podział zbioru strategii chodowych gracza A. Zbiór 
strategii chodowych gracza A zadany jest postacią 
(p. wzór 3.1) 

Y y2f •••» yit •••» y w } 

Uwzględniając poszczególne piętra dendrytu, zbiór 
Y możemy przedstawić również w postaci jako 

7= {Y 1 , Y 2 , Y n , Y m j (3.7) 

gdzie Y n zawiera elementy y t z n-tsgo piętra dendrytu. 

W dendrycie gry przed optymalizacją z każdego 
wierzchołka A£ dendrytu wychodzi zbiór krawędzi 
opisanych różniącymi się między sobą strategiami 
chodowymi gracza A. Zbiór ten ma postać 

M " = {y ri , y r2 , ■■■, y rc } (3.8) 
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Stąd też dowolny zbiór typu Y" możemy przed¬ 
stawić jako następującą sumę zbiorów 

Y n = M\ U M\ U ... U M£ n U ... U M „ 3.9) 

Przedstawione wyżej zbiory typu S* i M k będą nam 
pomocne przy opisie procesu jednostronnej opty¬ 
malizacji dendrytu gry przy pomocy maszyny cyfro¬ 
wej. Jak wiadomo, maszyna cyfrowa może rozwiązać 
dany problem wtedy, gdy problem ten został odpo¬ 
wiednio sformalizowany i znany jest algorytm roz¬ 
wiązania danego problemu. 

Na podstawie algorytmu rozwiązania danego pro¬ 
blemu układa się dla maszyny cyfrowej program 
obliczeń, zgodnie z którym realizuje ona proces 
obliczeń. W przypadku jednostronnej optymalizacji 
dendrytu gry zarówno algorytm, jak i program 
opracowywane są ściśle na podstawie reguł pro¬ 
wadzenia tej gry, której dendryt ma być optymalizo¬ 
wany przez maszynę cyfrową. Omówienie takiego 
algorytmu, a tym bardziej programu, nawet na po¬ 
ziomie bardzo ogólnym, wykracza poza ramy niniej¬ 
szej książki. Załóżmy więc, że realizując jedno¬ 
stronną optymalizację dendrytu gry, maszyna cyfrowa 
działa zgodnie z odpowiednim programem zawartym 
w jej pamięci oraz dysponuje wszelkimi danymi do 
przeprowadzenia tej optymalizacji. Ponadto dla 
uproszczenia naszych rozwiązań załóżmy również, 
że rozpatrujemy taką grę wielochodową, która ma 
Irzyelementowy zbiór wyników końcowych 

i? = {Pi, Pa, Pa} 

Zbiór ten obejmuje odpowiednio wygraną gracza A 
(symbol p x ), wygraną gracza B (symbol p 2 ) oraz 
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remis, odpowiadający punktowi siodłowemu gry 
(symbol p 3 ). Możliwy fragment dendrytu takiej gry 
przedstawiony został na ryc. 9. 

Wstępnym etapem jednostronnej optymalizacji den¬ 
drytu gry jest osiągnięcie jednego z wierzchołków 
końcowych dendrytu, tj. zbudowanie pierwszej 
ścieżki dendrytu. Ścieżka taka charakteryzuje pewną 
fikcyjną partię gry rozegraną przez elektroniczną 
maszynę cyfrową w celu uzyskania jednego z możli¬ 
wych wyników końcowych gry. Zgodnie z ryc. 9 
wierzchołek końcowy pierwszej ścieżki dendrytu 
wskazuje na wygraną gracza A. Właściwy proces 
optymalizacji zapoczątkowany jest cofnięciem się 
od wierzchołka końcowego do najbliższego wierz¬ 
chołka typu B, tj. i?/ 1 , 

Z wierzchołka Bl 1 wychodzą trzy krawędzie, 
z których każda opisana jest elementem z i przy¬ 
należnym do pewnego zbioru Si 2 zawierającego 
wszystkie możliwe do wykonania strategie chodowe 
gracza B w sytuacji opisanej wierzchołkiem Bi 1 . 
Zbiór S 12 maszyna cyfrowa kompletuje sobie sama, 
według zadanego jej algorytmu optymalizacji den¬ 
drytu i reguł prowadzenia gry. W interpretacji ma¬ 
szyny cyfrowej każdy element z s e S 12 jest krawędzią 
wychodzącą z wierzchołka Bi 1 . Wraz z kompleto¬ 
waniem zbioru ,5* 2 następuje jego analiza. Sprowadza 
się ona do sprawdzenia, czy w zbiorze krawędzi 
wychodzących z wierzchołka Bi 1 znajduje się choć 
jedna taka krawędź, która bezpośrednio doprowadza 
do wierzchołka końcowego dendrytu. Jeżeli tak, 
wówczas sytuacja określona wierzchołkiem Bl 1 
jest niekorzystna dla gracza A. Stąd też, aby do niej 
nie dopuścić, należy wykreślić z dendrytu krawędź 
łączącą wierzchołek B/ 1 z wierzchołkiem Al 1 , 
a następnie przystąpić do analizy pozostałych kra¬ 
wędzi zbioru Ml 1 . 
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Jeżeli natomiast w wyniku analizy zbioru Si 2 
okaże się, że żadna z krawędzi tego zbioru nie do¬ 
prowadza bezpośrednio w posunięciu n = 12 do 
wierzchołka końcowego, to zostanie wykonany ruch 
wzdłuż drugiej krawędzi zbioru Si 2 i analiza zostanie 
przesunięta do wierzchołka Al 2 . Właśnie taki przy¬ 
padek zilustrowany jest na ryc. 9. Dalszy proces opty¬ 
malizacji przebiega podobnie. 

Jak wiadomo, podstawowym warunkiem opty¬ 
malizacji jest to, aby z dowolnego wierzchołka typu 
AU jednostronnie zoptymalizowanego dendrytu gry 
wychodziła tylko jedna krawędź. Stąd też, po uzys¬ 
kaniu dwóch jednostronnie zoptymalizowanych frag¬ 
mentów dendrytu, zbudowanych na dwóch krawę¬ 
dziach wychodzących z tego samego wierzchołka 
typu A?, jeden z tych fragmentów należy odrzucić 
jako niekorzystny dla gracza A. Możliwym do przy¬ 
jęcia kryterium odrzutu jest określenie dla każdego 
zoptymalizowanego fragmentu dendrytu maksymalnej 
liczby posunięć N, przy których pomocy w trakcie 
realizacji gry zostałby osiągnięty najwyżej położony 
wierzchołek końcowy w interesującym nas frag¬ 
mencie dendrytu. Z przedstawionych na ryc. 9 dwóch 
fragmentów dendrytu, oznaczonych przez E i F, 
fragment F jest bardziej korzystny dla gracza A, 
gdyż N e > N F . 

W procesie jednostronnej optymalizacji dendrytu 
gry niektóre jego części składowe nie są w ogóle 
rozpatrywane, a mianowicie te, które normalnie 
byłyby zbudowane na krawędziach określonych 
w wyniku analizy jako niekorzystne dla gracza A. 

Przedstawienie pełnego algorytmu jednostronnej 
optymalizacji dendrytu gry wykracza poza ramy 
niniejszego rozdziału. Stąd też przedstawionej po¬ 
wyżej krótkiej charakterystyki nie należy uogólniać 
do całego procesu optymalizacji, w którym istotne 
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jest uwzględnienie wszystkich możliwych przypad¬ 
ków uwarunkowanych strukturą dendrytu. 

Pewną ilustrację rezultatów uzyskiwanych w wyniku 
jednostronnej optymalizacji dendrytu gry daje po¬ 
równanie rycin 9 i 10. Dendryt przedstawiony na 



Ryc. 10 


ryc. 10 został uzyskany w wyniku jednostronnej 
optymalizacji dendrytu gry z ryc. 9 i, jak to wynika 
z porównania rysunków, zawiera znacznie mniejszą 
liczbę krawędzi i wierzchołków. 


Minimalizacja jednostronnie zoptymalizowanego 
dendrytu gry 

Jednostronnie zoptymalizowany na korzyść 
gracza A dendryt gry jednoznacznie określa optymalne 
postępowanie tego gracza w procesie realizacji gry. 


7 Teoria gier w cybernetyce 
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Aby gracz A mógł prowadzić grę zgodnie z jedno¬ 
stronnie zoptymalizowanym dendrytem gry, musiał¬ 
by mieć przed sobą rysunek tego dendrytu lub mu¬ 
siałby pamiętać wszystkie jego ścieżki. Zarówno 
jedno, jak i drugie jest najczęściej niemożliwe. 

Bardziej realne i praktyczne jest korzystanie z ze¬ 
stawu tablic zawierających odpowiedni zapis wszyst¬ 
kich ścieżek jednostronnie zoptymalizowanego den¬ 
drytu gry. Jednakże najbardziej nowoczesnym podej¬ 
ściem — szczególnie istotnym w procesach sterowa¬ 
nia — jest zastąpienie gracza A automatem, który 
zdolny byłby do zapamiętania jednostronnie zopty¬ 
malizowanego dendrytu gry i do prowadzenia gry 
zgodnie z konfiguracją ścieżek tego dendrytu. Auto¬ 
matem tym może być maszyna cyfrową (komputer) 
lub specjalnie do tego celu zbudowany automat 
rozgrywający (por. rozdz. 5). W przypadku wyko¬ 
rzystania maszyny cyfrowej jednostronnie zopty¬ 
malizowany dendryt gry zapamiętany byłby w jej 
pamięci. W przypadku automatu rozgrywającego 
jednostronnie zoptymalizowany dendryt gry zawarty 
by był w strukturze tego automatu, tzn. struktura 
automatu byłaby pewnym fizycznym modelem tego 
dendrytu. 

W obu przypadkach zachodzi konieczność zmniej¬ 
szenia rozmiarów jednostronnie zoptymalizowa¬ 
nego dendrytu gry. Zmniejszyć rozmiary dendrytu 
znaczy — tak go zredukować, aby przy zmniej¬ 
szonych rozmiarach zachował on te same właściwości. 
Proces związany ze mniejszeniem rozmiarów jedno¬ 
stronnie zoptymalizowanego dendrytu gry nosi nazwę 
minimalizacji. Celem minimalizacji jednostronnie 
zoptymalizowanego dendrytu gry jest zmniejszenie 
liczby jego krawędzi i wierzchołków przez pokrycie 
się pewnych, tzw. izomorficznych części składowych 
dendrytu. 
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Pojęcie izomorfizmu jest jednym z ciekawszych 
pojęć w matematyce. Spotykamy się z nim wtedy, 
kiedy zachodzi konieczność ustalenia pewnej okreś¬ 
lonej równoważności (odpowiędniości), występującej 
między elementami dwóch różnych układów. 

Rozpatrywano układy nazywa się izomorficznymi, 
jeżeli mają postać jednakową z interesującego nas 
punktu widzenia. Gdy określona odpowiedniość 
między układami nie jest spełniona, wówczas układy 
są nieizomorficzne względem siebie. Na przykład 
mapa pewnego terenu i sam teren są układami izo¬ 
morficznymi ze względu na formę rzeźby terenu. 
Rzeki, jeziora, pola, łąki, występujące w terenie, 
mają na mapie swoje odpowiedniki w postaci symbo¬ 
licznych znaków. Jednak wtedy, gdy uwzględnimy 
takie cechy terenu, jak zapach kwitnących łąk, kolor 
wody w jeziorach, piękno krajobrazu, oba układy nie 
są izomorficzne, ponieważ na mapie brak odpo¬ 
wiedników tych cech. Podobnie dwa grafy, na przy¬ 
kład dwa dendryty, są izomorficzne wtedy, gdy mają 
jednakową strukturę — jednak izomorfizm ten doty¬ 
czy tylko struktury dendrytów i może nie być speł¬ 
niony przy określaniu odpowiędniości między zbio¬ 
rami symboli opisujących krawędzie obu dendry¬ 
tów. 

Pojęcie izomorfizmu jest bardzo przydatne w za¬ 
gadnieniach związanych z minimalizacją jedno¬ 
stronnie zoptymalizowanego dendrytu gry. Anali¬ 
zując jednostronnie zoptymalizowany dendryt gry 
możną stwierdzić, że niektóre jego części składowe 
mają jednakową strukturę i są opisane taką samą 
kombinacją elementów z } , y t . Wśród tych części 
składowych możemy wyróżnić takie, które mają 
postać dendrytów składowych, tzn. mają obowiąz" 
kowo swój wierzchołek początkowy i wierzchołki 
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końcowe, nie licząc wierzchołków leżących na innych 
poziomach. 

Dendryty składowe charakteryzujące się wymie¬ 
nionym wyżej podobieństwem — tzn. podobień¬ 
stwem struktury i opisu — noszą nazwę w pełni 
izomorficznych względem siebie dendrytów składo¬ 
wych. W pełni izomorficzne względem siebie den¬ 



dryty składowe, wchodzące w skład danego jedno¬ 
stronnie zoptymalizowanego dendrytu gry, można 
na siebie nałożyć. W ten sposób kilka izomorficz¬ 
nych dendrytów składowych zostaje sprowadzonych 
do jednego dendrytu składowego. Dla ilustracji tego 
zagadnienia na ryc. 11 przedstawiono dwa w pełni izo¬ 
morficzne względem siebie dendryty składowe Cj 
i C u leżące na jednakowym poziomie pewnego 
jednostronnie zoptymalizowanego dendrytu gry. 
Oba dendryty składowe, przedstawione na ryc. 11, 
mają jednakową strukturę, przy czym są opisane 
jednakową kombinacją elementów z Jt z t — chociaż 
dla przejrzystości rysunku pokazano opis tylko 
jednej ścieżki, zakładająo, że pozostałe odpowiada¬ 
jące sobie ścieżki obu dendrytów w niczym się między 
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sobą nie różnią. W wyniku nałożenia na siebie obu 
dendrytów C t i C, uzyskuje się jeden dendryt skła¬ 
dowy C Jti . Dendryt ten pokazano na ryc. 12, ozna¬ 
czając umownie operację nałożenia dendrytów sym¬ 
bolem +. 

Dendryt składowy C jA odzwierciedla w dalszym 
ciągu te same właściwości, którymi charakteryzowały 
się dendryty Cj i C h 


a w strukturze jedno¬ 
stronnie zoptymalizo¬ 
wanego dendrytu gry 
jest zminimalizowaną 
częścią składową tego 
dendrytu. Z ryc. 12 wy¬ 
nika, że w otrzymanym 
w wyniku minimalizacji 
dendrycie składowym 
Cj,i znajdują się jak 
gdyby dwa korzenie 
tego dendrytu, któ¬ 
rymi są wierzchołki 



(%’9r) 
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3 i Bi 3 . Jeżeli w procesie prowadzenia gry 


powstanie sytuacja określona wierzchołkiem Bf~ 3 
lub Bf~ 3 , a gracz B zastosuje strategię chodową z 5 , 
to zgodnie z dendrytem C Ui gracz A — lub repre¬ 
zentujący go automat — wykona strategię chodową y t 
i gra potoczy się dalej zgodnie z dendrytem C Jtt tak, 
jak gdyby to był dendryt C s czy też C t . W sytuacji 
określonej wierzchołkiem Bf~ 3 lub Bf~ 3 nie ma żad¬ 
nej różnicy w prowadzeniu gry czy to według den¬ 
drytów Cj, C u czy też według dendrytu zminimalizo¬ 
wanego C Jti . 

Bardzo często w pełni izomorficzne względem 
siebie dendryty składowe mogą znajdować się na 
różnych poziomach jednostronnie zoptymalizowanego 
dendrytu gry. Na przykład dendryt składowy C t 
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z ryc. 11 może mieć swój korzeń, tzn. swój wierzcho¬ 
łek początkowy, w piętrze n = 6, a izomorficzny den- 
dryt składowy C } może mieć swój korzeń w piętrze 
n — 9. Również te dendryty można ze sobą pokryć 
po odpowiednim przesunięciu dendrytu C t o trzy 
piętra. A więc w pełni izomorficzne dendryty skła¬ 
dowe, wyróżnione w jednostronnie zoptymalizo¬ 
wanym dendrycie gry, podlegają wzajemnemu po¬ 
kryciu bez przesunięcia dendrytów względem siebie 
lub też po odpowiednim ich przesunięciu. Po doko¬ 
naniu wszystkich możliwych takich pokryć zmniej¬ 
szone zostaną rozmiary jednostronnie zoptymalizo¬ 
wanego dendrytu gry, co znacznie ułatwia zapamię¬ 
tanie tego dendrytu w pamięci maszyny cyfrowej czy 
też w strukturze automatu rozgrywającego. 

Metody minimalizacji jednostronnie zoptymalizo¬ 
wanego dendrytu gry mogą być bardzo różne i zależą 
zarówno od struktury dendrytu, jak i od jego opisu. 
Nie zawsze w jednostronnie zoptymalizowanym 
dendrycie można wyróżnić w pełni izomorficzne 
dendryty składowe. Nierzadko dendryty składowe są 
izomorficzne pod względem struktury, a nie są izo¬ 
morficzne pod względem opisujących je elementów 
Zj, y t — i noszą wtedy nazwę częściowo izomorficz¬ 
nych. Jeżeli co najmniej dwa dendryty składowe 
mają taką samą strukturę, lecz opisane są inną kom¬ 
binacją elementów Zj, y u to mogą być nałożone na 
siebie po określeniu zachodzących relacji pomiędzy 
odpowiadającymi sobie elementami z Jt yi w tych 
dendrytach. Dla ilustracji tego zagadnienia na ryc. 13 
przedstawiono dwa izomorficzne pod względem 
struktury dendryty składowe Ci i C 2 . 

Wierzchołki początkowe obu dendrytów składo¬ 
wych znajdują się na jednakowym poziomie jedno¬ 
stronnie zoptymalizowanego dendrytu gry. Dla 
ułatwienia minimalizacji każdemu z dendrytów przy- 
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porządkowuje się pewien parametr p, np. dendry- 
towi Cx przyporządkowuje się parametr p u a den- 
drytowi C 2 parametr p 2 . 



Po takim przyporządkowaniu parametrów jeden 
z dendrytów potraktować można jako dendryt 
odniesienia, względem którego przeprowadzona bę¬ 
dzie minimalizacja. W dendrycie odniesienia wpro¬ 
wadza się następujące oznaczenia elementów: y t = w t 
oraz Zj = Sj. 

Załóżmy, że dendrytem odniesienia jest dendryt C x . 
Po wprowadzeniu oznaczeń y, = w t i z, = s,, uzy¬ 
skamy pewien dendryt zastęp¬ 
czy, który, oznaczony umownie 
symbolem Ci, przedstawiony zo¬ 
stał na ryc. 14. Dendryt za¬ 
stępczy C\ reprezentuje zarówno 
dendryt C u jak i C 2 . Zależność 
między elementami y i z den- 
drytu C lt a elementami w i s 
dendrytu Ci jest następująca 

Zi = z 2 = s 2 , y 2 — w 2 , 
y 4 = Wą. itd. 

Natomiast zależność między elementami dendrytu C 2 
a elementami dendrytu Ci wygląda już nieco inaczej. 



Ryc. 14 
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gdyż 


Z 9 = J 3 , Z 1 = s lt Z Ą = s 7 , z 10 = s 6 , 
ye = vt> 4 , y t = w 2 , y n = w s , y 9 = w 3 

Symbole 5 i w przedstawiają jak gdyby pewne fikcyjne 
strategie chodowe obydwu graczy. Ponieważ den- 
dryt Ci reprezentuje dwa dendryty Ct i C 2 , zachodzi 
konieczność przeprowadzenia w procesie realizacji 
gry identyfikacji rzeczywistych strategii chodowych 
graczy ze strategiami fikcyjnymi, opisującymi den- 
dryt zastępczy Ci. Do identyfikacji tej potrzebne są 
wprowadzone wyżej parametry p t i p 2 . Jeżeli np. 
gracz A dysponuje jednym dendrytem Ci zamiast 
dwóch dendrytów C t i C 2 , to po znalezieniu się gry 
w sytuacji określonej wierzchołkiem 2?f -2 musi on 
otrzymać informację o aktualnym parametrze p. 
Gdy zna ten parametr p, tj. p = p x lub p = p 2 > 
łatwo może przejść na rzeczywisty układ strategii 
chodowych przez zmianę elementów s i w dendrytu 
Ci na odpowiednie elementy z i y. 

Omówione w niniejszym punkcie dwie metody 
minimalizacji jednostronnie zoptymalizowanego den¬ 
drytu gry — zresztą omówione bardzo pobieżnie 
— sygnalizują w zasadzie tylko istnienie problemu 
minimalizacji dendrytu. W ogólnym przypadku mini¬ 
malizacja jednostronnie zoptymalizowanego den¬ 
drytu jest problemem złożonym i niedostatecznie 
jeszcze opracowanym. Ze względu na złożoność 
tego problemu, jego rozwiązanie w większości kon¬ 
kretnych gier opisujących procesy sterowania opiera 
się na wykorzystaniu maszyn cyfrowych. 


Gry wielochodowe parametryczne 

Dotychczas rozpatrywaliśmy takie gry wielocho¬ 
dowe, w których wyróżnia się tylko jedną sytuację 
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początkową gry. Pewnym uogólnieniem tych gier 
jest gra w szachy, charakteryzująca się m.in. tym, 
że występuje w niej jedna sytuacja początkowa, 
określona przez początkowe położenie figur na sza¬ 
chownicy poprzedzające pierwszy ruch „białych” 
Wiadomo powszechnie, że początkowe ug^powanie 
figur na szachownicy jest ściśle określone i nie pod¬ 
lega przed rozpoczęciem gry żadnym zmianom, bez 
względu na to, ile razy grę tę będziemy rozgrywać. 
Wyłącznie jedna sytuacja początkowa istnieje tnie** 
w grze w warcaby oraz w innych grach. Dendryty 
tych gier mają tylko jeden wierzchołek początkowy. 

Nie zawsze jednak w grze wielochodowej istnieje 
tylko jedna sytuacja początkowa gry. Wynika to 
z tego, że gra z reguły opisuje pewien proces, a stany 
początkowe procesu mogą być różne. Na przykład 
operacja bojowa wojsk, biorących udział w kon¬ 
flikcie wojennym, może rozpocząć się przy różnym 
ugrupowaniu bojowym obu przeciwstawnych sobie 
stron. W zależności od sytuacji początkowej, charak¬ 
teryzującej się m.in. przyjętym ugrupowaniem bo¬ 
jowym, pa opisująca proces prowadzenia operacji 
bojowej będzie miała taki lub inny przebieg. W pro¬ 
cesie tego typu występuje więc dość znaczna liczba 
stanów początkowych; taką samą liczbę sytuacji' 
początkowych będzie miała gra opisująca ten proces; 
Dla ilustracji tego zagadnienia wróćmy do omawia¬ 
nej już (s. 66) w przykładzie 3 gry, którą rozpatry¬ 
wano tam z punktu widzenia tylko jednego położe¬ 
nia początkowego obiektów: A — samochodu po¬ 
licyjnego i B samochodu przestępców. Jednakże 
liczba początkowych położeń obiektów może być 
bardzo duża, a w przypadku nieograniczonej płasz¬ 
czyzny pościgu jest liczbą nieskończoną. Każde 
położenie początkowe obiektów A i B z ryc. 2 jest 
sytuacją początkową gry. Ponieważ każde możliwe 
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położenie obiektów względem siebie może być po¬ 
łożeniem początkowym, liczba sytuacji początko¬ 
wych w grze opisującej wymieniony proces pościgu 
będzie bardzo duża. W interpretacji graficznej każda 
sytuacja początkowa w grze wielochodowej jest 
wierzchołkiem początkowym dendrytu gry. Den- 
drytów będzie więc tyle, ile jest wierzchołków po¬ 
czątkowych, tzn. tyle, ile jest sytuacji wyjściowych 
w grze. 

Uzyskamy więc całą rodzinę dendrytów, z których 
każdy opisuje tę samą grę, jednakże przy innej sy¬ 
tuacji początkowej. Kompletny dendryt takiej gry 

— przy skończonej liczbie sytuacji początkowych 

— jest więc zbiorem dendrytów, określonym przez 
wyrażenie 

D = ^4) •••» di, •••) d w } (3.10) 

gdzie di — dendryt przyporządkowany i-tej sytuacji 
początkowej. Sytuacje początkowe gry, w celu od¬ 
różnienia ich od siebie, można ponumerować licz¬ 
bami całkowitymi lub przyporządkować im umowne 
symbole p u p 2 , ..., p łf .... 

Wielkości te, przeznaczone do identyfikacji sytuacji 
początkowych, noszą nazwę parametrów gry, a ich 
wyraz ogólny oznaczać będziemy symbolem p. 
W zależności od wartości parametru p gra jest re¬ 
prezentowana odpowiednim dendrytem ze zbioru D. 
Z tych też powodów indeksy opisujące parametry 
gry p = Pu Pi, •••» Pt, ••• odpowiadają indeksom 
opisującym elementy d% zbioru Z>. 

Ze względu na pojęcie parametru gry, omawiany 
typ gry wielochodowej nosi nazwę gry wielochodo¬ 
wej parametrycznej. Gra wielochodowa parame¬ 
tryczna jest więc to taka gra wielochodowa z pełną 
informacją, w której występują co najmniej dwie 
sytuacje początkowe. W interpretacji graficznej gra 
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wielochodowa parametryczna jest reprezentowana 
dendrytem D, składającym się co najmniej z dwóch 
wierzchołków początkowych, na których zbudowane 
są oddzielne dendfyty d%. Dendryt gry wielochodowej 



Ryc. 15 


parametrycznej przedstawiony został w sposób sym¬ 
boliczny na ryc. 15. Dendryty d t , składowe den¬ 
drytu D, przyjęto nazywać dendrytami podstawo¬ 
wymi. Każdy dendryt podstawowy d t <=■ D ma 
przyporządkowany sobie parametr p u który wy¬ 
różnia go w strukturze dendrytu D. 

W celu określenia optymalnego postępowania 
gracza A w grze wielochodowej parametry cznej 
należy przeprowadzić jednostronną optymalizację 
dendrytu D. Optymalizację tę realizuje się oddziel¬ 
nie dla każdego dendrytu podstawowego d t <= D. 
Należy jednak zauważyć, że gra wielochodowa 
parametryczna opisuje najczęściej bardzo złożony 
proces. Zapamiętanie przez gracza A jednostronnie 
zoptymalizowanego dendrytu D lub też posługiwanie 
się tym dendrytem w trakcie przebiegu gry jest na 
ogół niemożliwe. Stąd też w tego typu grach gracza A 
z reguły będzie reprezentował automat rozgrywający 
lub też odpowiednio zaprogramowany komputer. 

W związku z tym — z przyczyn uzasadnionych 
już w poprzednim punkcie — zachodzi konieczność 
minimalizacji jednostronnie zoptymalizowanego den¬ 
drytu D. Sposób przeprowadzenia tej minimalizacj i 
zależy od struktury dendrytu. Otóż jednostronnie 
zoptymalizowany dendryt gry parametrycznej składa 
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się z zoptymalizowanych dendrytów podstawo¬ 
wych d t mających różne rozmiary i różną strukturę. 
Wśród tych dendrytów można znaleźć co najmniej 
jeden taki dendryt d u który w porównaniu do po¬ 
zostałych charakteryzuje się największymi rozmia¬ 
rami. Względem dendrytu d t o największych roz¬ 
miarach, noszącego na- 
x- > & zwe dendrytu odniesie- 

^ 7 niaj przeprowadza 

proces minimalizacji. 

Polega ona na tym, 
że wszystkie jedno¬ 
stronnie zoptymalizo¬ 
wane dendryty podsta¬ 
wowe d t <= D nakłada 
się na dendryt odniesie¬ 
nia, zważając nie na ich 
opis, a tylko na strukturę. Wynikiem takiego 
nałożenia będzie pewien dendryt zastępczy D', 
zawierający jeden wierzchołek początkowy repre¬ 
zentujący wszystkie wierzchołki początkowe den¬ 
drytu D. W dęndrycie zastępczym D' można wyróżnić 
strukturę każdego zoptymalizowanego dendrytu 
di <= D. Dla ilustracji na ryc. 16 przedstawiono 
symbolicznie dendryt zastępczy D' zawierający 
w sobie struktury trzech dendrytów: d u d 2 , d 3 . 

Strukturę dendrytu zastępczego D', a ściślej mó¬ 
wiąc krawędzie tego dendrytu, opisuje się symbolami 
Sj i w i. Dla dendrytu podstawowego d t (max), będą¬ 
cego dendrytem odniesienia, między elementami z 
i y opisującymi jego krawędzie a elementami s i w 
opisującymi krawędzie dendrytu zastępczego D' 
istnieje następująca zależność 


y t = w t 
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Dla pozostałych dendrytów podstawowych za¬ 
leżność ta musi być całkiem inna, np. 

Zj = (Sjp i ^ Hj. 

Jak już wiadomo, symbole w i s opisujące krawędzie 
dendrytu zastępczego D' noszą nazwę fikcyjnych 
strategii chodowych graczy. Dla gracza A zbiór jego 
fikcyjnych strategii chodowych przedstawia się na¬ 
stępująco 

W = {w u w 2 , ..., w h ..., w,} (3.11) 

Analogicznie zbiór fikcyjnych strategii chodowych 
gracza B zadany jest postacią 

S = {s t , s 2 , (3.12) 

Przejście z rzeczywistych strategii chodowych na 
fikcyjne strategie chodowe opisujące dendryt za¬ 
stępczy D', przy ustalonej wartości parametru p u 
w większości przypadków jest określone następującą 
parą funkcji 

r J = 'Pi(z, fi) |p t =const (3.13) 

W = ®j(_y, w) jp, = const (3.14) 

Z przedstawionych zależności wynika, że przy usta¬ 
lonej wartości parametru p t wartość fikcyjnej stra¬ 
tegii chodowej gracza zależy od aktualnej rzeczy¬ 
wistej strategii chodowej danego gracza i numeru 
kolejnego posunięcia w grze. 

Stąd też, aby móc określić aktualną fikcyjną 
strategię chodową gracza w procesie prowadzenia 
gry o parametrze p t , należy znać rzeczywistą strategię 
chodową wykonaną przez gracza oraz numer kolej¬ 
nego posunięcia w grze. W niektórych grach wielo- 
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chodowych parametrycznych wymienione funkcje 
mogą mieć prostszą postać, a mianowicie 

s = 'F|(z)U= const (3.15) 

W = ®|(y) \pi = eonst (3.16) 

Jednakże bardzo często może zdarzyć się przypadek, 
że w celu zapewnienia jednoznacznego odwzoro¬ 
wania zbioru Z w zbiór S oraz zbioru Y w zbiór W 
należy posługiwać się parą funkcji 

S = W t (z, Y) |pł = const (3.17) 

w — 0((y, y) (p<=const (3.18) 

W wyrażeniach tych symbol y oznacza numer po¬ 
rządkowy aktualnego wierzchołka dendrytu. 

Znajomość dendrytu zastępczego D' oraz przed¬ 
stawionych wyżej funkcji umożliwia określenie 
struktury automatu rozgrywającego, przeznaczo¬ 
nego do realizacji gry wielochodowej parametry¬ 
cznej w interesie gracza A. 

Bardzo często gra wielochodowa parametryczna 
składa się z kilku cykli, tzn. jest powtarzana kilka¬ 
krotnie aż do uzyskania określonego końcowego 
wyniku gry. W każdym cyklu jest rozgrywana jedna 
partia gry, reprezentowana odpowiednim jedno¬ 
stronnie zoptymalizowanym dendrytem d % wcho¬ 
dzącym w skład struktury dendrytu zastępczego D'. 

Każdorazowo po zakończeniu danej partii gry 
następuje przejście od aktualnego wierzchołka koń¬ 
cowego dendrytu zastępczego D' do wierzchołka 
początkowego tego dendrytu — przejście to połą¬ 
czone jest ze zmianą parametru p t lub bez jego 
zmiany. Dendryt zastępczy gry parametrycznej 
z cyklem został przedstawiony symbolicznie na ryc. 17. 
Pojęcie gry wielochodowej parametrycznej ułatwia 
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kompozycję odpowiedniego modelu matematycz¬ 
nego, przydatnego do opisu wielu procesów stero¬ 
wania. Stąd też prace związane z formalnym opisem 



tych gier mają duże znaczenie w cybernetyce technicz¬ 
nej i rzutują na rozwój odpowiedniej klasy auto¬ 
matów skończonych, zapewniając realną możliwość 
wykorzystania tych automatów w procesach opty¬ 
malnego sterowania. 



Rola teorii gier w cybernetyce 


Wstępne pojęcie o cybernetyce 

Cybernetyka jest niewątpliwie jedną z naj¬ 
bardziej współczesnych nauk. Sam termin „cyber¬ 
netyka” pochodzi od starogreckiego słowa kyberne- 
tes , co znaczy „sternik”, ewentualnie „kierujący”. 
W dziełach pisarzy starożytnych, np. Platona, 
„cybernetyka” jest wymieniona jako nauka o za¬ 
rządzaniu prowincją. W 1834 r. Amper, klasyfikując 
nauki, wprowadził cybernetykę do spisu nauk spo¬ 
łecznych. Obecnie cybernetykę rozumie się jako naukę 
o sterowaniu w sensie ogólnym i związanym z nim 
przetwarzaniu informacji, występującej w procesie 
sterowania, oraz zalicza się ją do nauk ścisłych. 

Idea stworzenia cybernetyki jako uogólnionej 
nauki o sterowaniu zrodziła się tuż przed wybuchem 
II wojny światowej w wyniku dyskusji z zakresu 
metodyki badań naukowych, prowadzonych przez 
grupę amerykańskich naukowców z ośrodka Harward 
Medical School. W tej grupie czołową pozycję zaj¬ 
mował amerykański matematyk Norbert Wiener 
i zaprzyjaźniony z nim Meksykanin Arturo Rosen- 
blueth. Celem prowadzonych przez nich dociekań 
naukowych było przezwyciężenie niebezpieczeństw 
nadmiernej specjalizacji w nauce, której konsek¬ 
wencją było oddzielenie od siebie poszczególnych 



nauk. Uczeni ci doszli do wniosku, że powinna 
istnieć pewna nauka uogólniająca tematy leżące 
dotychczas odłogiem na pograniczu różnych dyscy¬ 
plin, jednakże nie potrafili jeszcze dokładnie spre¬ 
cyzować zakresu tej nauki. Wybuch II wojny świato¬ 
wej i spowodowane nim ukierunkowanie prac nau¬ 
kowych dla potrzeb wojska narzuciły wyjściową 
tematykę dla rodzącej się nauki. Otóż nie zweryfiko¬ 
wane dotąd wnioski, wynikające wyłącznie z roz¬ 
ważań naukowych, zostały znacznie rozwinięte w trak¬ 
cie opracowywania urządzenia sterującego ogniem 
artylerii przeciwlotniczej. Uczestnicząc w pracach 
badawczych nad tego typu urządzeniem Wiener 
i współpracujący z nim matematyk J. Bigelow 
stwierdzili, że istnieje daleko idąca zbieżność między 
procesami sterowania i przekazywania sygnałów 
w urządzeniach technicznych i w organizmach 
żywych. Zarówno wtedy, kiedy obiektem steruje 
człowiek, jak i wtedy, kiedy sterowanie odbywa się 
automatycznie, na proces sterowania wpływa infor¬ 
macja o rezultatach tego sterowania, otrzymywana 
od sterowanego obiektu drogą sprzężenia zwrotnego. 
Spostrzeżenia Wienera i Bigelowa, przekonsulto¬ 
wane z fizjologiem Rosenbluethem, zostały wy¬ 
korzystane przy badaniu przebiegu samosterowal- 
ności w organizmach żywych. W wyniku przepro¬ 
wadzonych tego typu badań Wiener oraz współ¬ 
pracujący z nim naukowcy uświadomili sobie, że 
problemy komunikacji, sterowania i mechaniki sta¬ 
tycznej stanowią zasadniczo jedną całość, niezależnie 
od tego czy dotyczą maszyny, czy istoty żywej. 

Jednakże brak było takiej jednej wspólnej dzie¬ 
dziny nauki, która by obejmowała te wszystkie 
problemy, a tym samym brak było odpowiedniej 
nazwy dla tej dziedziny. W rezultacie poszukiwań 
odpowiedniej nazwy wybór padł na słowo kyber- 
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netes, którego sens odpowiadał całkowicie cało¬ 
kształtowi rozpatrywanych problemów. W ten spo¬ 
sób we współczesnym spisie nauk pod terminem 
„cybernetyka” pojawiła się nowa gałąź wiedzy. Pod¬ 
stawowe pojęcia cybernetyki, jej cele i zakres zo¬ 
stały sprecyzowane we wspomnianej, napisanej przez 
Norberta Wienera i wydanej w 1948 r. książce Cyber¬ 
netyko czyli sterowanie i komunikacja w zwierzęciu 
i maszynie. 

Cybernetyka jako synteza wielu nauk i to często¬ 
kroć całkowicie różniących się między sobą jest spe¬ 
cyficzną nauką. Obejmuje bardzo szeroki zakres te¬ 
matów, wśród których, oczywiście między innymi, 
można wyróżnić takie działy, jak teoria automatów, 
teoria systemów, teoria informacji, teoria sterowa¬ 
nia oraz szereg innych działów przynależnych rów¬ 
nież do innych nauk, takich jak biologia, psycholo¬ 
gia, medycyna, ekonomia, lingwistyka itd. 

Przedmiotem cybernetyki są prawa sterowa¬ 
nia, odnoszące się zarówno do urządzeń technicz¬ 
nych, jak i organizmów żywych. Sterowanie jest 
celowym oddziaływaniem na określone zjawiska 
lub obiekty fizyczne. Sterowanie może pochodzić 
z zewnątrz lub może być właściwością samego obiektu 
i wówczas mówimy o samosterowaniu lub auto¬ 
matyzmie. Obiekt, który charakteryzuje się samo- 
sterowalnością, nazywamy automatem. Obiektem 
takim może być urządzenie techniczne lub organizm 
żywy. Z tego punktu widzenia mózg ludzki i elek¬ 
troniczna maszyna cyfrowa, służące do możliwie 
najszerszej realizacji tej samej w obu przypadkach 
funkcji samosterowania, są w jednakowym stopniu 
organizmami automatycznymi, a więc są automatami. 
Cybernetyka narusza więc utarte poglądy na temat 
roli człowieka, traktując go na równi z innymi orga¬ 
nizmami, a nawet maszynami. Na pierwszy rzut oka 
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takie podejście wydaje się nie do przyjęcia. Zwykle 
uważa się, że automat jest czymś bezwładnym, 
bezdusznym, niezdolnym do różnorodnych działań. 
Jednakże w samym słowie „automat” nie ma nic 
oprócz wskazówki, że dany układ działa sam, bez 
ingerencji z zewnątrz. W takim ujęciu działanie 
maszyny jako automatu czy też działanie prostego 
organizmu żywego lub człowieka są jednakowo 
definiowane, pomimo że zakres i charakter działania 
maszyny mogą się znacznie różnić od charakteru 
i zakresu działania organizmu żywego. Inaczej 
mówiąc cybernetyka nie stawia pytania „co to jest 
za przedmiot”, lecz klasyfikuje dany przedmiot 
według tego, jak się on zachowuje, tzn. na podstawie 
tego czy przedmiot jest sterowany z zewnątrz, czy też 
wykazuje cechę samosterowalności. Ponieważ stero¬ 
wanie w sensie ogólnym jest procesem celowym, 
cybernetykę można zdefiniować jako naukę o celo¬ 
wości lub o układach o działaniu celowym. Uwzglę¬ 
dniając natomiast stosowane w cybernetyce metody 
badawcze można sformułować twierdzenie, że cyber¬ 
netyka jest nauką, która z pomocą doświadczenia 
i aparatu matematycznego bada celowość i samo- 
sterowanie w przyrodzie i technice. Ponieważ przy¬ 
roda i technika są domeną zainteresowań specja¬ 
listów z różniących się między sobą dziedzin nauki, 
w celu ujednolicenia terminologii zostało wprowa¬ 
dzone do cybernetyki pojęcie systemu. Przez 
system rozumie się zespół dowolnych elementów, 
traktowanych jako pewna całość i pozostających 
w ściśle określonym wzajemnym związku. Systemem 
może być org anizm żywy, urządzenie techniczne, 
przedsiębiorstwo przemysłowe, rakieta kosmiczna 
itp. Każdy system działa w pewnym otoczeniu. Oto¬ 
czeniem danego systemu nazywamy zbiór wszystkich 
nie należących do systemu obiektów, których właś- 
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ciwości oddziałują na system i zarazem ulegają 
zmianie pod wpływem działania tego systemu. Ze 
względu na reakcję systemu z otoczeniem, systemy 
możemy podzielić na układy (systemy) bezwzględnie 
odosobnione i układy względnie odosobnione. 

System będący układem bezwzględnie odosobnio¬ 
nym nie ma ani jednego wejścia i ani jednego wyjścia 
prowadzącego poza system do otoczenia, tzn. nie 
występuje wymiana energii czy też informacji między 
systemem a otoczeniem. Natomiast system będący 
układem względnie odosobnionym nie jest zupełnie 
izolowany od swego otoczenia i ma co najmniej 
jedno wyjście do otoczenia. W praktyce spotykamy 
się najczęściej z systemami będącymi układami 
względnie odosobnionymi. 

Cybernetyka zajmuje się badaniem tylko takich 
systemów, które zorganizowane są w sposób celowy 
i są systemami z zachowaniem celowym. Systemem 
z zachowaniem celowym nazywamy taki system, 
który działa na otoczenie i reaguje na jego wpływy 
w taki sposób, aby został osiągnięty określony cel. 
Jeżeli w dążeniu do osiągnięcia określonego celu 
system steruje sam sobą, wówczas mówimy, że 
system taki charakteryzuje się zdolnością do samo- 
regulacji lub samosterowaniem. W systemie mającym 
właściwość samosterowania wyróżnia się część ste¬ 
rującą i część sterowaną. System złożony z części 
sterującej i części sterowanej, a więc system, w którym 
występuje proces sterowania, nazywamy systemem 
sterowania. W żywym organizmie, potraktowanym 
jako system, częścią sterującą jest centralny układ 
nerwowy, a częścią sterowaną są organy ruchu lub 
też inne narządy. W dowolnym systemie sterowania 
proces sterowania może być realizowany tylko 
wówczas, gdy część sterująca systemu będzie otrzy¬ 
mywała informację o wynikach sterowania, a więc 
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musi istnieć pewne sprzężenie między częścią ste¬ 
rującą systemu a częścią sterowaną. 

W ogólnym przypadku sprzężeniem między do¬ 
wolnymi obiektami nazywamy związek polegający 
na odpowiednim oddziaływaniu obiektów na siebie. 
Sprzężenie, w którym jeden z obiektów oddziałuje 
na drugi tak, jak to przedstawiono na ryc. 18 a 



Ryc. 18 


dla obiektów A i B, nazywamy sprzężeniem 
prostym. Sprzężenie, w którym dwa obiekty A 
i B oddziałują nawzajem na siebie nazywamy sprzę¬ 
żeniem zwrotnym, co przedstawiono na 
ryc. 18 6. Na sprzężenie zwrotne składają się wobec 
tego dwa sprzężenia proste przeciwnie skierowane, 
sprzężenie zwrotne tworzy więc zamknięty obieg 
oddziaływań. 

Sprzężenie zwrotne jest najbardziej podstawowym 
i eksponowanym pojęciem w cybernetyce, co uzasad¬ 
nione jest tym, że w procesach sterowania zawsze 
istnieje sprzężenie zwrotne. Występuje ono w przy¬ 
rodzie tak powszechnie, że jest po prostu wszech¬ 
obecne. Wielką rolę sprzężenia zwrotnego w proce¬ 
sach sterowania uwypuklił Norbert Wiener porów¬ 
nując proces sterowania w opracowywanym przez 
siebie sytemie kierowania ogniem artylerii przeciw¬ 
lotniczej z procesem sterowania występującym 
w organizmie żywym. Na wielu przykładach łatwo 
można stwierdzić, że zarówno w maszynie będącej 
automatem, jak i w organizmie człowieka proces 
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sterowania polega na porównaniu aktualnego dzia- 
łania z odpowiednim działaniem zadanym, a więc 
w obu przypadkach występuje sprzężenie zwrotne. 
Wyjaśnimy to na następujących dwóch przykładach. 

Przypuśćmy, że człowiek chce podnieść leżący 
przed nim ołówek. Żeby to uczynić, musi wprawić 
w ruch pewne mięśnie, a więc wykonać’ ruch ręką 
w kierunku ołówka. Ruch ręki odbywa się tak by 
w miarę upływu czasu odległość ręki od ołówka 
ulegała zmniejszeniu. Czynność ta przebiega auto¬ 
matycznie i najczęściej nie jest w pełni uświado¬ 
miona przez człowieka. Odbywa się to w ten sposób, 
że mózg człowieka otrzymuje od oczu bezustannie 
informacje, mówiące o pozycji ręki. Dzięki tym 
informacjom mózg wykonuje jak gdyby obliczenia, 
których wynikiem są odpowiednie instrukcje na¬ 
kazujące mięśniom ręki poruszanie nią w taki spo¬ 
sób, aby różnica między aktualnym a pożądanym 
położeniem ręki została usunięta. 

Rozpatrzmy teraz inny prosty przykład sprzęże¬ 
nia zwrotnego, dotyczący tym razem urządzenia 
technicznego. Mianowicie w pewnym pomieszcze¬ 
niu, w celu utrzymania stałej temperatury, zainsta¬ 
lowano piec ogrzewniczy z regulatorem temperatury 
połączonym z odpowiednim czujnikiem tempera¬ 
tury. Elementy te tworzą razem bardzo prosty sy¬ 
stem sterowania, w którym wyróżnić można część 
sterującą, złożoną z czujnika temperatury i regula¬ 
tora temperatury, oraz część sterowaną, którą jest 
piec ogrzewniczy. Pod wpływem działania czujnika 
regulator tak steruje mocą ogrzewczą pieca, aby 
usunąć różnicę między aktualną temperaturą w po¬ 
mieszczeniu a temperaturą zadaną, tj. ustaloną dla 
pomieszczenia. A więc i w tym przypadku istnieje 
sprzężenie zwrotne, gdyż informację o wynikach 
sterowania odbiera czujnik, przekazuje ją do regu- 


118 





latora, który z kolei na podstawie tej informacji 
steruje mocą ogrzewczą pieca. 

W układach sprzężenia zwrotnego mamy więc 
zamknięty obieg informacji. Z przedstawionych przy¬ 
kładów wynika, że sprzężenie zwrotne występujące 
w procesie sterowania determinuje jednoznaczne 
działanie systemów sterowania. 

Omówione w niniejszym punkcie podstawowe 
pojęcia cybernetyki, takie jak sterowanie, system 
i sprzężenie zwrotne, zajmują czołową pozycję 
w zbiorze wszystkich innych możliwych pojęć zwią¬ 
zanych z cybernetyką. Pomimo że problematyka 
objęta cybernetyką jest bardzo rozległa i dotyczy 
zagadnień z różnych dziedzin życia, nauki i techniki, 
we wszystkich rozpatrywanych problemach cyber¬ 
netycznych z pojęciami tymi zawsze się spotykamy. 
Z tych samych względów przedstawiona wyżej krótka 
charakterystyka cybernetyki i jej podstawowych 
pojęć ułatwi Czytelnikowi zrozumienie problemów 
cybernetycznych, rozpatrywanych w dalszej części 
niniejszej książki. 


System i sterowanie 

Jak to stwierdziliśmy w poprzednim punkcie, 
podstawowym przedmiotem zainteresowań cyberne¬ 
tyki są prawa sterowania odnoszące się zarówno do 
urządzeń technicznych, jak i organizmów żywych. 
W cybernetyce przyjęto stosować dla urządzeń 
technicznych i organizmów żywych ogólną nazwę 
systemu o zachowaniu celowym. Stąd też bardzo 
często mówi się, że współczesna cybernetyka jest 
ogólną teorią sterowania dowolnych systemów o za¬ 
chowaniu celowym. System może być sterowany 
z zewnątrz albo też, w dążeniu do uzyskania okreś- 
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lonego celu, może sam sobą sterować. Przedmiotem, 
dalszych naszych rozważań będą tylko takie systemy, 
które sterują same sobą, a więc cechują się samo- 
sterowalnością. Zachowanie się systemu w czasie 
jego działania charakteryzują pewne wielkości, które 
mogą przyjmować różne wartości. Wielkości te są 
bądź właściwościami systemu, bądź też tymi właści¬ 
wościami otoczenia, które mają wpływ na zachowa¬ 
nie się systemu. Wielkości charakteryzujące stan 
systemu bez uwzględnienia wpływu otoczenia noszą 
nazwę własności systemu. Własność -systemu to 
pewna jego cecha, której wielkość (wartość) w funkcji 
czasu może się zmieniać. 

Na przykład rakietę kosmiczną jako system charak¬ 
teryzują takie własności, jak masa rakiety, szybkość 
rakiety, współrzędne rzeczywiste położenia rakiety, 
itp., a więc wielkości, których wartość w funkcji 
czasu podlega zmianie. Czasami pojęcie „własność 
systemu” zastępuje się pojęciem „dziedzina”, mając 
na uwadze dziedziny przedsięwzięć, w których za¬ 
kresie system funkcjonuje. Na przykład dla zakładu 
przemysłowego traktowanego jako system dzie¬ 
dziną może być produkcja, transport, zaopatrzenie 
itp. 

Każdy system może mieć kilka własności, ewen¬ 
tualnie dziedzin, które go charakteryzują, np. X u 
X 2 , ..., X { , ..., X m . Dowolna własność X t systemu 
może przyjmować różne wartości leżące w okreś¬ 
lonym przedziale, przy czym wśród tych różnych 
wartości pewne wartości przyjmuje się jako wyróż¬ 
nione. Aktualną w danej chwili wartość własności 
nie zawsze można dokładnie określić, stąd też wyraża 
się ją w sposób przybliżony z pomocą wartości wy¬ 
różnionych. Na przykład temperatura dała człowieka, 
będąca jedną z jego właśdwości, przyjmuje wartośd 
z przedziału 34—42°C. W tym przedziale liczba 
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możliwych wartości temperatury jest nieskończona. 
Ponieważ jednak pomiaru temperatury dokonujemy 
termometrem lekarskim o zdolności rozdzielczej 
0,1°C, w praktyce mamy do czynienia ze skończo¬ 
nym zbiorem wartości temperatury ciała człowieka 
— zbiór ten zawiera tylko 81 elementów. 

Posługując się pojęciem wartości wyróżnionej, 
w dalszych naszych rozważaniach będziemy przyj¬ 
mować, źe własność systemu charakteryzuje się 
przyporządkowanym sobie skończonym zbiorem war¬ 
tości. Dla własności X t zbiór taki będziemy wyrażać 
następującą postacią 

X t = {x il5 x h , ..., x t) , ..., x t „] (4.1) 


W systemie będącym układem bezwzględnie od¬ 
osobnionym aktualne w danej chwili wartości 
wszystkich własności X u X 2 , X t , ..., X m , podane 
w wartościach wyróżnionych, jednoznacznie okreś¬ 
lają stan systemu. Stan ten możemy wyrazić symbo¬ 
licznie następującym wektorem 


x = [x u x 2 . 


x t . 




(4.2) 


gdzie Xl — i-ta współrzędna wektora jc przyjmująca 
wartości ze zbioru X t . 

Olbrzymia większość systemów rozpatrywanych 
w cybernetyce należy do układów względnie od¬ 
osobnionych. W celu określenia stanu systemu 
będącego układem względnie odosobnionym na¬ 
leży uwzględnić również aktualne wartości tych 
własności przynależnych do otoczenia, które oddzia¬ 
łują na system lub ulegają zmianie pod wpływem 
tego systemu. Na przykład, gdy systemem jest sa¬ 
molot, to otoczeniem tego systemu jest atmosfera, 
chociaż nie wyłącznie, bo otoczeniem mogą być 
inne samoloty, ukształtowanie terenu lądowiska itp. 


Takie własności atmosfery, jak wilgotność, stan 
zachmurzenia, ciśnienie itp. rzutują na zachowanie 
się samolotu w powietrzu. Stan systemu jest więc 
określony nie tylko przez własności przynależne do 
systemu, lecz również przez pewne własności oto¬ 
czenia. Oznaczając te własności otoczenia symbo¬ 
lami H 1 , H 2 , ..., Hj, ..., H r , stan systemu możemy 
wyrazić wektorem 

^ 1 ^ 1 , * 2 , •**, h\ 9 ^ 2 ) •••, hj> ..., h r 1 

(4.3) 

którego współrzędne typu x t i h j reprezentują od¬ 
powiednio aktualne wartości własności typu X t i H } . 
Uwzględniając wszystkie możliwe wartości współ¬ 
rzędnych wektora z, otrzymamy zbiór dopusz¬ 
czalnych stanów systemu przedstawiony w postaci 

Z = {z u z 2 , ..., Zj . z s ) (4.4) 

Elementy zbioru Z reprezentują różniące się między 
sobą stany systemu, z których każdy wyraża się ana¬ 
litycznie wektorem o postaci wektora z zadanego 
wyrażeniem (4.3). Zgodnie z przyjętym założeniem, 
że zbiory wartości poszczególnych własności typu 
X t i Hj są zbiorami skończonymi, zbiór Z jest rów¬ 
nież zbiorem skończonym. 

Działanie systemu z zachowaniem celowym charak¬ 
teryzuje się tym, że system dąży do uzyskania okreś¬ 
lonego celu zgodnie z zadaną funkcją celu. Zadany 
cel można uzyskać w różny sposób i z różnym efek¬ 
tem końcowym. Na przykład, samolot — potrak¬ 
towany przez nas jako system z zachowaniem ce¬ 
lowym — może wznieść się na określoną wysokość 
wykonując lot według różnych trajektorii i przy 
różnych prędkościach. A więc istnieje pewien zbiór 
możliwych wariantów działania samolotu, którego 
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celem jest osiągnięcie określonej wysokości. Na 
zbiorze możliwych wariantów działania samolotu 
określona jest funkcja celu, uwarunkowana koniecz¬ 
nością dokonywania wybora wariantu. Każdemu 
wariantowi możemy przyporządkować peWną liczbę, 
która go charakteryzuje i jednocześnie jest wartością 
funkcji celu. Wartość funkcji celu nosi nazwę zysku. 
Zysk określa się według odpowiednio dobranego 
kryterium efektywności. Na przykład dla samolotu 
kryterium efektywności może być czas, po którym 
osiągnie on pożądaną wysokość, może być ilość 
zużytego paliwa lub równie dobrze kryterium efek¬ 
tywności może dotyczyć obydwu tych wielkości. Przy 
wykonywaniu określonych czynności, leżących w za¬ 
kresie funkcjonowania systemu, system realizuje 
pewne decyzje. W systemie, który steruje sam sobą, 
decyzje te wypracowuje część sterująca. 

W każdym systemie charakteryzującym się samo- 
sterowalnością można zawsze wyróżnić centralny 
organ sterujący, będący elementem składowym sy¬ 
stemu. Dla człowieka organem takim jest mózg, 
natomiast dla bezzałogowej rakiety kosmicznej, nie 
sterowanej z Ziemi, organem sterującym jest specjalny 
automat będący jedną z części składowych rakiety. 
Decyzje wypracowane przez organ sterujący na¬ 
zywamy wielkościami sterującymi systemu. Podstawą 
do wypracowania decyzji sterującej działaniem sy¬ 
stemu jest informacja o aktualnym stanie systemu. 
Istota samosterowalności systemu polega na tym, 
że system tak dobiera sobie decyzje, aby w wyniku 
ich realizacji mógł znaleźć się w możliwie najlepszym 
stanie. Wiadomo jednak, że w funkcji czasu stany 
systemu zmieniają się. Przyczynia się do tego zarówno 
działanie samego systemu, jak i wpływ otoczenia 
na zachowanie się systemu. W dążeniu do uzyskania 
zadanego celu zmiany stanu systemu powinny prze- 
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biegać tak, aby cel ten zrealizowany został z jak 
najlepszym efektem, którego miarą jest możliwie 
maksymalna wartość funkcji celu. Stąd też przejście 
systemu od jednego do drugiego stanu powinno być 
odpowiednio sterowane. Sterowanie sprowadza się 
do tego, że na podstawie informacji o aktualnym 
stanie systemu jest wypracowywana odpowiednia 
decyzja, która określa czy system powinien pozo¬ 
stać w danym stanie, czy też powinien zmienić swój 
stan. Funkcjonowanie systemu jest więc związane 
z pewnym procesem decyzyjnym. Proces ten jest 
najczęściej wieloetapowy, gdyż funkcjonowanie sy¬ 
stemu przebiega w czasie, z kolei czas ten można 
rozbić na poszczególne etapy, różniące się między 
sobą pewną specyfiką działania systemu. 

W ogólnym przypadku wieloetapowy proces de¬ 
cyzyjny ma charakter dyskretny, tj. decyle do stero¬ 
wania systemem są wypracowywane tylko w ściśle 
określonych momentach czasu. Wypracowana na 
danym etapie — w dyskretnym momencie czasu 
— decyzja nosi nazwę decyzji etapowej. Decyzja 
etapowa jest wielkością sterującą działaniem systemu 
na danym etapie jego funkcjonowania. W urządze¬ 
niach technicznych i w organizmach żywych wiel¬ 
kość sterująca ma postać odpowiedniego sygnału 
sterującego. Sygnał sterujący, wypracowany przez 
organ sterujący systemu, sterując działaniem po¬ 
szczególnych elementów systemu oddziałuje na 
własności systemu. W wyniku tego oddziaływania 
wartości poszczególnych własności charakteryzują¬ 
cych działanie systemu ulegają zmianie. Własności 
systemu, na które oddziałuje sygnał sterujący, noszą 
nazwę wielkości sterowanych, a elementy systemu 
sterowane sygnałem sterującym nazywają się ele¬ 
mentami sterowanymi. Na przykład dla rakiety 
wielkością sterowaną jest kierunek lotu, prędkość. 
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ciąg silników itp.; często też mówimy, że sterujemy 
prędkością rakiety, kierunkiem lotu, ciągiem silników. 

Aktualne wartości wielkości sterowanych wpły¬ 
wają na stan systemu. Jednak stan systemu jest 
określany nie tylko przez wielkości sterowane, lecz 
również przez wielkości nie sterowane. Wielkościami 
nie sterowanymi są te własności otoczenia, które 
oddziałują na system. Wielkości nie sterowane, 
zmieniające się w czasie w sposób losowy i mające 
wpływ na stan systemu, noszą nazwę wielkości 
zakłócających. Sygnał sterujący wypracowany na 
podstawie informacji o aktualnym stanie systemu 
jest decyzją dotyczącą tylko zmiany wartości wiel¬ 
kości sterowanych. Ponieważ w systemie najczęściej 
wyróżnia się kilka wielkości sterowanych, sygnał 
sterujący reprezentuje decyzję złożoną z decyzji, 
dotyczących poszczególnych wielkości sterowanych. 

W ogólnym przypadku decyzja do sterowania 
systemu, podobnie jak i stan systemu, wyraża się 
analitycznie w postaci następującego wektora 

y ~ [yxn y xi , •••> y Xi i •••» Ja:™] (4.5) 

gdzie współrzędna y Xt jest decyzją dotyczącą stero¬ 
wania własnością X t (wielkością sterowaną) systemu. 
Zbiór możliwych wartości dowolnej współrzędnej y Xi 
wektora y jest skończony, co jest zgodne z przyjętym 
przez nas założeniem, że zbiór wartości własności X t 
jest skończony. Uwzględniając wszystkie możliwe 
wartości współrzędnych wektora y, zbiór możliwych 
decyzji do sterowania systemem wyrazi się zbiorem 

Y = {y lf y 2 , .... y t , y w ) (4.6) 

Każdy element y t zbioru Y jest decyzją etapową, 
która może być podjęta przez system w trakcie jego 
funkcjonowania. Natomiast ściśle określony ciąg 
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decyzji etapowych, w których wyniku system uzys" 
kuje cel swego działania, nosi nazwę decyzji pełnej. 

Zbiory Z i Y oraz istniejące między elementami 
tych zbiorów relacje są podstawowymi składowymi 
modelu matematycznego opisującego proces stero¬ 
wania systemem. Model ten, ze względu na wielo- 
etapowość procesu decyzyjnego zachodzącego w sy¬ 
stemie, najwygodniej jest przedstawić w postaci 
dwuosobowej gry wielochodowej. 


Gra jako model abstrakcyjny procesu stero¬ 
wania 

Działanie systemu z zachowaniem celowym 
w funkcji czasu jest pewnym procesem, realizowa¬ 
nym przez system w dążeniu do uzyskania określo¬ 
nego celu końcowego. Na przykład, gdy systemem 
jest zakład przemysłowy, to procesem takim jest 
proces produkcji. Dla rakiety kosmicznej procesem 
takim może być proces zbliżania się do innego obiektu 
kosmicznego. Obiekt sterujący systemu, wypraco¬ 
wując odpowiednie sygnały sterujące, a więc sterując 
systemem, wpływa na proces funkcjonowania sy¬ 
stemu w ściśle określony sposób tak, aby działanie 
systemu przebiegało w pożądanym kierunku. Stąd 
też proces funkcjonowania systemu jest procesem 
sterowanym, natomiast wszystkie czynności zwią¬ 
zane ze sterowaniem nazywane są procesem stero¬ 
wania. 

W ogólnym przypadku proces sterowania rozumie 
się jako całokształt przedsięwzięć związanych z wy¬ 
wieraniem pożądanego wpływu na określone zja¬ 
wiska i procesy. Bardzo często proces sterowania 
możemy opisać modelem matematycznym dwu¬ 
osobowej gry wielochodowej. Posługując się takim 
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modelem, proces sterowania traktujemy umownie 
jako proces prowadzenia pewnej gry wielochodowej. 
W takiej interpretacji procesu sterowania bardzo 
istotną rolę odgrywa odpowiedni dobór i określenie 
przeciwstawnych sobie stron gry. Możliwym do 
przyjęcia podejściem do tego zagadnienia jest po¬ 
traktowanie organu sterującego systemem jako 
jednej strony gry, natomiast części sterowanej sy¬ 
stemu, wraz z pewnymi własnościami otoczenia 
jako drugiej strony gry. Pewnymi własnościami 
otoczenia, które należy uwzględnić w zdefiniowaniu 
części sterowanej systemu jako strony gry, są te 
własności otoczenia, które wpływają na działanie 
systemu. Po zdefiniowaniu stron gry możemy je 
oznaczyć symbolami A i B. Pod symbolem A bę¬ 
dziemy rozumieć organ sterujący systemu, a pod 
symbolem B część sterowaną systemu wraz z wy¬ 
mienionymi wyżej własnościami otoczenia. Zbiorem 
strategii chodowych strony B gry jest zbiór możli¬ 
wych stanów systemu. Zbiór ten ma postać 
(p. wzór 4.4) 

Z ^2, Zj, ..., Z s ) 

Zbiorem strategii chodowych strony A gry jest zbiór 
możliwych decyzji etapowych do sterowania sy¬ 
stemem. Zbiór ten ma postać (p, wzór 4.6) 

^ 2 j •••» yi> •••> y w } 

Reguły gry opisującej dany proces sterowania wy¬ 
nikają z charakteru działania systemu oraz z za¬ 
danej funkcji celu. Grę taką umownie można po¬ 
traktować jako grę antagonistyczną. Mianowicie 
można założyć, że strona A gry będzie dążyła do 
maksymalizowania wartości funkcji celu, natomiast 
strona B gry będzie dążyła do minimalizacji tej funkcji. 
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Ponadto można przyjąć, że strona B gry zachowuje 
się jak natura, gdyż na działanie systemu wpływa 
wiele czynników losowych, uwarunkowanych wpły¬ 
wem otoczenia i wynikających z charakteru funkcjo¬ 
nowania systemu. Przy takim założeniu stronę A 
gry należy potraktować jako rozumnego gracza, 
który wykorzystując błędy popełniane przez gracza B 
(naturę) będzie maksymalizował swoją wygraną. 

Przyjęty model sterowania, dający się opisać po¬ 
stacią dwuosobowej gry wielochodowej, został po¬ 
glądowo przedstawiony na ryc. 19. Jak to już było 


hj h% h r 



organ sterujący 
systemu 

Ryc, 19 


« * * I • ! # t * 

podane w poprzednim punkcie, działanie systemu 
w czasie można podzielić umownie na etapy. Z tych 
też względów proces sterowania jest procesem wielo¬ 
etapowym. Na początku każdego etapu organ ste¬ 
rujący systemu, będący stroną A gry, na podstawie 
informacji o aktualnym stanie systemu wybiera 
odpowiednią strategię chodową, będącą decyzją 
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do sterowania systemem. Ponieważ funkcja celu 
w wieloetapowym procesie decyzyjnym ma charak¬ 
ter addytywny (osiągnięcia systemu na poszcze¬ 
gólnych etapach sumują się), każdej strategii cho¬ 
dowej y t e Y gracza A można przyporządkować 
pewien zysk etapowy. Gracz A powinien tak pro¬ 
wadzić grę z graczem B, aby na ostatnim etapie 
sumaryczny zysk ze wszystkich etapów był możliwie 
największy. Znaczy to, że na dowolnym etapie 
organ sterujący systemem na podstawie informacji 
o stanie systemu, tj. o strategii chodowej gracza B, 
powinien zastosować taką strategię chodową y t e Y, 
która w konsekwencji możliwych stanów systemu 
w następnych etapach i zastosowanych na tych 
etapach strategii chodowych e F zapewnia otrzy¬ 
manie największego zysku sumarycznego. 

Jak wiadomo, zasada prowadzenia dwuosobowej 
gry wielochodowej polega na tym, że obaj gracze 
wykonują ruchy na przemian, aż do osiągnięcia 
końcowego celu gry. Ruch gracza B i odpowiedź na 
ten ruch gracza A tworzą sekwencję ruchów z J} y t . 
Tak uporządkowana para z J} y t nosi nazwę posunięcia 
w grze i warunkuje sobą proces sterowania systemem 
na danym etapie jego funkcjonowania, gdyż z 3 jest 
stanem systemu, a y t — decyzją podjętą przez organ 
sterujący A ze względu właśnie na aktualny stan z 3 . 
Postacią graficzną gry wielochodowej opisującej 
proces sterowania jest dendryt gry. Ponieważ organ 
sterujący systemem jest stroną gry zainteresowaną 
w optymalnym działaniu systemu, nie może on do¬ 
puścić do tego, aby gra potoczyła się po niekorzystnej 
ścieżce dendrytu. Stąd też w dowolnej sytuacji organ 
sterujący, jako gracz A, zmuszony jest dokonywać 
wyboru odpowiedniej strategii chodowej. Wybór 
ten łączy się z analizą dendrytu gry. Czas przezna¬ 
czony na podjęcie decyzji bardzo często jest tak 
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krótki, że uniemożliwia dokonywanie analizy den- 
drytu gry w celu wyboru odpowiedniej strategii 
chodowej. Stąd też z konieczności strategia cho¬ 
dowa gracza A nie będzie w pełni optymalna. Kło¬ 
potów tych można uniknąć przeprowadzając wcześ¬ 
niej, tj. przed rozpoczęciem procesu sterowania, 
jednostronną optymalizację dendrytu gry. Jedno¬ 
stronna optymalizacja dendrytu gry polega na wy¬ 
eliminowaniu z niego niekorzystnych dla gracza A 
jego strategii chodowych. Optymalizację tę z zasady 
przeprowadza się przy zastosowaniu maszyny cyfro¬ 
wej. Jednostronnie zoptymalizowany dendryt gry 
jest algorytmem optymalnego działania dla organu 
sterującego systemem. Znając ten algorytm, organ 
sterujący systemem A można zastąpić maszyną cyfro¬ 
wą lub specjalnie zbudowanym do tego celu automa¬ 
tem rozgrywającym, którego strukturę można okreś¬ 
lić na podstawie struktury jednostronnie zoptymali¬ 
zowanego dendrytu gry. Podział stron gry opisu¬ 
jącej proces sterowania zależy w dużym stopniu od 
charakteru funkcjonowania systemu. Jeżeli systemem 
jest zautomatyzowany zakład przemysłowy, to wów¬ 
czas stroną A gry opisującej proces sterowania może 
być system cyfrowy (komputer), a drugą stroną gry, 
tj. stroną B, będą wszystkie jednostki organizacyjne 
tego zaldadu. Oczywiste jest, że przy określaniu 
stanów systemu będących strategiami chodowymi 
strony B należy uwzględnić aktualne wartości pew¬ 
nych własności tych obiektów otoczenia, które 
mają wpływ na działanie systemu. Na przykład taką 
właściwością otoczenia dla danego zakładu prze¬ 
mysłowego jest produkcja innego zakładu, który 
jest zakładem kooperującym. 

Taki podział stron gry nie zawsze jest możliwy. 
Bardzo często zachodzi konieczność potraktowania 
systemu jako jednej strony gry, a pewnych obiektów 
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otoczenia lub pewnych procesów zachodzących 
w otoczeniu — jako drugiej strony gry. 

Innym możliwym podejściem jest rozpatrywanie 
procesu sterowania w ujęciu gry wielochodowej 
prowadzonej między dwoma systemami, których 
działania są mniej lub bardziej przeciwstawne sobie. 
Przeciwstawne sobie działania systemów wynikają 
z pewnej sytuacji konfliktowej, w której znajdują się 
oba systemy. Z drugiej strony wiadomo, że modelem 
matematycznym sytuacji konfliktowej jest gra. 
W tym prżypadku grę rozpatrujemy z punktu widze¬ 
nia tego systemu, dla którego działania jest opraco¬ 
wywany algorytm optymalnego sterowania. Algo¬ 
rytm ten determinuje proces sterowania systemem 
jako proces prowadzenia przez system pewnej gry. 
Pozostały system, będący stroną B gry, może być 
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Ryc. 20 


potraktowany jako natura lub jako rozumny prze¬ 
ciwnik. Ilustracją podejścia do procesu sterowania 
jako do procesu prowadzenia gry jest ryc. 20. Zgod¬ 
nie z tym rysunkiem, organ sterujący systemu A, 
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oznaczony symbolem A', opracowuje optymalne 
decyzje do sterowania systemem na podstawie in¬ 
formacji ze Z charakteryzującej działanie systemu B. 
Decyzje te, będące wielkościami sterującymi dla 
części A" systemu A, mogą być potraktowane jako 
strategie chodowe gracza A. Podobnie informacja z 
o obiekcie B potraktowana może być jako infor¬ 
macja o stosowanych przez gracza B strategiach 
chodowych. 

Proces sterowania systemem A powinien prze¬ 
biegać tak, aby system osiągnął końcowy cel swego 
działania z maksymalnym efektem. System B może 
nie dopuścić do uzyskania przez system A pozytyw¬ 
nego efektu końcowego, jeżeli działanie systemu A 
nie będzie z góry określone, i to tak, aby dla każdej 
powstałej sytuacji istniała tylko jedna ściśle określona 
strategia chodowa postępowania systemu. A więc 
i w tym przypadku, podobnie jak w poprzednim, 
trzeba dokonać wcześniejszej analizy dendrytu gry, 
połączonej z jego jednostronną optymalizacją na 
korzyść systemu A. Jak wiadomo, charakterystyczną 
cechą jednostronnie zoptymalizowanego dendrytu 
gry jest to, że przedstawia on taki rodzaj gry, w której 
jeden z graczy ma z góry narzucone sobie optymalne 
strategie swego postępowania. Dlatego też przy 
realizacji gry według jednostronnie zoptymalizo¬ 
wanego dendrytu gry system A nie będzie dokonywał 
w dowolnej sytuacji wyboru strategii chodowej 
w zbiorze możliwych strategii chodowych przy¬ 
porządkowanych tej sytuacji, gdyż dysponuje już 
tylko jedną, optymalną dla tej sytuacji strategią 
chodową. Omówiony przypadek procesu sterowania 
— rozumianego jako proces prowadzenia gry — 
przeciwną stroną, którą jest inny system, rozpatrzony 
zostanie na przykładzie procesu pościgu w roz¬ 
dziale 7. 
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Przedstawiona tutaj krótka charakterystyka nie 
’ obejmuje wszystkich możliwych sposobów podejścia 
do procesu sterowania jako do procesu prowadzenia 
pewnej gry wielochodowej. 

Jednakże na podstawie narzucających się wnios¬ 
ków należy podkreślić, że abstrakcyjne modele 
procesów sterowania, oparte na wykorzystaniu 
aparatu formalnego gier wielochodowych, uwy¬ 
puklają ogromną rolę i przydatność teorii gier w cy¬ 
bernetyce. Interpretacja niektórych problemów cy¬ 
bernetyki oparta na pojęciu gry wielochodowej 
umożliwia ich optymalne rozwiązanie. To z kolei 
pozwala na budowę samodzielnych systemów cy¬ 
bernetycznych, których zasada działania opiera się 
na procesie prowadzenia gry wielochodowej. Głów¬ 
nym organem sterującym tego typu systemu jest 
automat skończony, który ze względu na zasadę 
działania nosi nazwę automatu rozgrywającego. 
Automat ten może być automatem abstrakcyjnym, 
wyrażonym w postaci programu dla maszyny cyfro¬ 
wej sterującej danym systemem, lub też może być 
automatem rzeczywistym, mającym postać odpo¬ 
wiedniego urządzenia technicznego o działaniu dys¬ 
kretnym. Ze względu na to, że zasady funkcjono¬ 
wania automatu rozgrywającego ściśle wiążą się 
z problematyką niniejszej książki, niezbędna jest 
krótka charakterystyka tego automatu, która zostanie 
przedstawiona w następnym rozdziale. 
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Automaty skończone — rozgrywaj 


Pojęcie automatu skończonego 

W poprzednich dwóch rozdziałach ki 
krotnie spotkaliśmy się z automatem rozgrywają 
jako urządzeniem wypracowującym optymalne 
cyzje w procesie sterowania systemem z zachc 
niem celowym. Struktura tego automatu i za; 
jego działania są ściśle związane z modelem n 
matycznym gry wielochodowej opisującej pr 
sterowania danym systemem. Przydatność autor 
rozgrywającego w sterowaniu działaniem koni 
nych sytemów podkreśla chyba najbardziej 
teorii gier w cybernetyce, jako bardzo wygodi 
aparatu formalnego przydatnego do opisu mc 
cybernetycznych, a jednocześnie wskazuje na c 
wość budowy tego typu automatu. Z tych też W2 
dów uzasadnione będzie przedstawienie kró 
charakterystyki automatu rozgrywającego. Ponie 
jednak automat rozgrywający jest automatem sl 
czonym, charakterystykę naszą poprzedzimy 
daniem podstawowych pojęć definiujących autc 
skończony oraz rozpatrzymy jego działanie i st 
turę. 

Automat skończony można sobie wyobrazić • 
„czarną skrzynkę”, do której wejścia jest podav 
informacja w postaci sygnału zj, na wyjściu 
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skrzynki, pod wpływem przetwarzania sygnał 
pojawia się sygnał y t — tak jak przedstawior 
symbolicznie na ryc. 21. Przy takim podejści 
automatu jako do „czarnej skrzynki” nie zwra 
uwagi na strukturę we¬ 
wnętrzną automatu, a inte¬ 
resuje nas tylko charakter 
przetwarzania informacji. 

Zwykle przyjmuje się, że sy¬ 
gnał Zj, pojawiający się na 
wejściu automatu, przynależy do pewnego i 
czonego zbioru możliwych dla automatu sygr 
wejściowych 



Z {-^ 1 ? z2, ...* Zj 9 Z s y 

Natomiast sygnał y t pojawiający się na wyjściu 
matu przynależy do zbioru możliwych dla auto 
sygnałów wyjściowych 

^ •••» y i> •••» 

przy czym zbiór ten jest również zbiorem skończo 
W automacie skończonym sygnał y t pojawiając 
na wyjściu automatu zależy nie tylko od syj 
wejściowego, lecz również od tzw. stanu we 
trznego automatu. W trakcie swego działania aut 
może znajdować się w różnych stanach we 
trznych. Podobnie jak w automacie, tak i w ka i 
organizmie żywym możemy wyróżnić aktualny v 
nej chwili dla tego organizmu jego stan wewnęt: 
Na przykład, człowiek może znajdować się w róż 
stanach: może być senny, głodny, syty, zdene 
wany, zadowolony itp. Stany wewnętrzne autoi 
tworzą zbiór 
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Zbiór ten jest zbiorem skończonym i jest nazywany 
zbiorem stanów wewnętrznych automatu. 

Praca automatu skończonego przebiega w ściśle 
określonych chwilach czasu: t 0 , t u t 2 , ... noszących 
nazwę czasów dyskretnych. W każdej chwili czasu 
dyskretnego na wejściu automatu pojawia się sygnał 
zj, ustala się określony stan wewnętrzny automatu, 
a na wyjściu pojawia się jeden z sygnałów wyjścio¬ 
wych przynależnych do zbioru Y. Po tych wstępnych 
sformułowaniach możemy podać dokładniejszą de¬ 
finicję automatu skończonego. Definicja ta brzmi 
następująco: automatem skończonym nazy¬ 
wamy dyskretny przetwornik informacji 
zdolny do przyjmowania różnych stanów, 
do przechodzenia pod wpływem sygnałów 
wejściowych z jednego stanu w inny i do 
generowania sygnałów wyjściowych — 
przy czym zbiór możliwych stanów, za¬ 
wiera skończoną liczbę elementów. 

Sygnały wejściowe automatu są informacją wej¬ 
ściową, natomiast sygnały wyjściowe reprezentują 
informację przetworzoną przez automat. Informacja 
przetworzona wyraża najczęściej pewne decyzje wy¬ 
pracowane przez automat. Aby decyzje te były 
optymalne dla dowolnej sytuacji, w jakiej automat 
się znajduje, jego działanie musi być ściśle określone. 
Stąd też automat skończony działa zgodnie z pewnym 
programem, uwarunkowanym strukturą automatu 
lub też przechowywanym w odpowiedniej postaci 
w jego pamięci. Program taki składa się z systemu 
rozkazów, które mogą być wykonywane przez 
automat. Każdy rozkaz jest jak gdyby wskazówką 
dla automatu, mówiącą co on ma zrobić. Rozkaz 
można zapisać w postaci 

q t z r -► q } y s 
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Zapis ten interpretujemy następująco: jeżeli automat 
znajduje się w stanie wewnętrznym q h a na wejście 
automatu podany zostanie sygnał z r , to pod wpły¬ 
wem tego sygnału automat przechodzi w stan q } 
i generuje sygnał wyjściowy y s . Działanie automatu 
skończonego można wyrazić również analitycznie 
przy pomocy dwóch funkcji, tzw. funkcji przejść 
i funkcji wyjść automatu. Funkcja przejść auto¬ 
matu skończonego ma następującą postać 

, (5.4) 

Funkcja ta mówi nam, że stan wewnętrzny automatu 
w chwili dyskretnej t+ 1 zależy od stanu automatu 
q(t) W poprzedniej chwili t i od sygnału , wejściowego 
z(t) przyłożonego na wejście automatu w chwili t. 
Funkcja wyjść automatu skończonego jest nato¬ 
miast wyrażona następującą postacią 

xo - ®wo, m (5.5> 

Zgodnie z tym wyrażeniem sygnał wyjściowy auto¬ 
matu y(t), a więc w chwili t, zależny jest od stanu 
wewnętrznego i sygnału wejściowego w tej samej 
dyskretnej chwili t. 

Najczęściej ze względów praktycznych działanie 
automatu zadaje się przy pomocy dwóch tablic: 
tablicy przejść, która określa funkcję przejść y ¥{q, z), 
i tablicy wyjść, która określa funkcję wyjść <$(<?, z). 
Wiersze obu tablic są oznaczone sygnałami wejścio¬ 
wymi automatu z, e Z, a kolumny — stanami we¬ 
wnętrznymi automatu q s e Q. 

Tablice te przedstawimy na przykładzie pewnego 
automatu abstrakcyjnego A. Załóżmy, że dla auto¬ 
matu A znany jest zbiór sygnałów wejściowych 
Z = {z u z 2 ), zbiór sygnałów wyjściowych Y = 
— {yuJk >^ 3 } oraz zbiór stanów wewnętrznych 
Q = {q u q 2 , # 3 }. Tablica przejść i tablica wyjść 
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automatu A, wyrażające tylko jedno z możliwych 
działań tego automatu, będą przedstawiać się na¬ 
stępująco 


Tabl. 1 

Tablica przejść \>{q,z) 


q 

z 


<h 

?3 

. z l 


?3 

<lx 

Z 2 

<h 

#3 

<13 


Tabl. 2 

Tablica wyjść Q>(q , z) 


q 

z 

9x 

* 

?3 

Zi 

i 


y i 

72 

%2 

73 

73 

73 


Na podstawie tablicy przejść można określić, jakie 
są możliwe przejścia automatu z danego stanu do 
innego stanu pod wpływem sygnałów wejściowych. 
Na przykład, jeżeli w danej chwili t automat znajduje 
się w stanie q u to w kolumnie opisanej symbolem q y 
znajdziemy wszystkie te stany, do których automat 
może przejść bezpośrednio ze stanu q y . Z przed¬ 
stawionej tablicy przejść wynika, że jeżeli automat 
znajduje się w stanie q u a na wejściu automatu 
pojawi się sygnał z x , to przechodzi on do stanu q 3 , 
gdy natomiast pojawi się sygnał z 2 , automat prze¬ 
chodzi do stanu q 2 . 

Tak jak na podstawie tablicy przejść można 
określić, do jakiego stanu może przejść automat 
w trakcie swego funkcjonowania, tak na podstawie 
tablicy wyjść można określić, jaki sygnał pojawi się 
na wyjściu automatu, gdy automat znajduje się 
w danym stanie q, a na jego wejściu pojawi się jeden 
z sygnałów wejściowych z 3 e Z. Z podanej jako 
przykład tablicy wyjść wynika, że gdy automat 
znajduje się w stanie q u a na wejściu pojawi się syg¬ 
nał z 1} to na wyjściu automatu pojawi się sygnał y 2 . 
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Automat skończony, zadany przedstawiony mi wy¬ 
żej tablicami przejść i wyjść, realizuje następujące 
rozkazy 

1) <h z i -+ 93^2 3) q 2 z t -> q z y x 5) q 3 z 1 q y y 2 

2 ) # l z 2 ^ 2^3 4 ) <? 2 Z 2 ^ 3^3 6 ) # 3 Z 2 “*• ^ 3)^3 

Rozkazy te tworzą program działania automatu. 

Bardzo często zamiast posługiwania się tablicami 
przejść i wyjść, działanie automatu wyraża się przy 
pomocy specjalnego wykresu. Wykres taki nosi 
nazwę grafu automatu. W grafie automatu wierz¬ 
chołki grafu przedstawiają stany automatu, a krawę¬ 
dzie są opisane symbolami sygnałów wejściowych 
i wyjściowych. Graf automatu jest kompozycją 
pewnej liczby grafów elementarnych. Dwa naj¬ 
bardziej typowe grafy elementarne przedstawiono 
na ryc. 22. Każdy graf elementarny jest odpowied- 



Ryc. 22 


nikiem rozkazu wykonywanego przez automat. Graf 
elementarny z ryc. 22 a realizuje rozkaz q i z r qjy s , 
a graf z ryc. 22 b realizuje rozkaz q t z r q t y s , z któ¬ 
rego wynika, że pod wpływem sygnału z r automat 
nie zmienia swego stanu q h Kompletny graf auto¬ 
matu zadanego przedstawionymi wyżej tablicami 
przejść i wyjść pokazano na ryc. 23. 


139 




Automaty skończone jako dyskretne przetworniki 
informacji można odpowiednio podzielić w zależności 
od sposobu ich działania, struktury wewnętrznej, 
funkcji, jakie spełniają itp. Najbardziej utarty jest 



podział automatów skończonych na tzw. automaty 
Mealy’ego i automaty Moore’a. Kryterium tego 
podziału jest postać funkcji przejść i wyjść opisu¬ 
jących działanie danego automatu. Automat Mea- 
ly’ego działa zgodnie z opisującą go parą funkcji 
przejść i wyjść podanych w postaci wyrażeń (5.4) 
i (5.5). Zasadnicza właściwość automatów MeaIy’ego 
polega na tym, że ich sygnały wyjściowe zależą 
zarówno od stanu wewnętrznego automatu, jak 
i od sygnału wejściowego. Dotychczas omawiany 
przez nas typ automatu skończonego był właśnie 
automatem Mealy’ego. 

Automat Moore’a tym się różni od poprzedniego, 
że jego sygnał wyjściowy nie zależy od sygnału wej¬ 
ściowego, lecz tylko od stanu wewnętrznego auto¬ 
matu. Automat Moore’a jest opisany następującą 
parą funkcji przejść i wyjść 
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q(t+l) - ^[q(t),z{t)} 

y(t ) = <%(*)] 


(5.6) 

(5.7) 


Funkcje te najczęściej są zadawane odpowiednią 
tablicą, noszącą nazwę oznakowanej tablicy przejść. 
Dla ilustracji, oznakowana tablica przejść auto¬ 
matu Moore’a dotycząca pewnego abstrakcyjnego 
automatu została przedstawiona niżej 


Tabl. 3 

Oznakowana tablica przejść 


syg¬ 

nał 

wyj¬ 

ścio¬ 

wy 

yi 

y 3 

y\ 

9 

Z 

9i 

92 

93 

Z l 

93 

93 

9i 

* 

92 

93 

#3 


Istnieje pewne podobieństwo między oznakowaną 
tablicą przejść automatu Moore’a a omówioną już 
tablicą przejść automatu Mealy’ego. 

Obie tablice zbudowane są podobnie, z tą różnicą, 
że w oznakowanej tablicy przejść automatu Moore’a 
nad symbolem każdego stanu wewnętrznego opisu¬ 
jącego kolumnę tablicy zapisuje się sygnał wyjściowy, 
jaki generuje automat w tym stanie. Działanie 
automatu Moore’a, podobnie jak automatu Mea- 
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ly’ego, można wyrazić graficznie przy pomocyjod- 
powiedniego grafu. Graf automatu Moore’a, wy¬ 
rażający działanie automatu zadanego przedsta¬ 
wioną już wyżej oznakowaną tablicą przejść (tabl. 3), 
zilustrowano na ryc. 24. Jak wynika z rysunku. 


** * 



krawędzie grafu automatu Moore’a są opisane tylko 
symbolami sygnałów wejściowych automatu, na¬ 
tomiast wierzchołki grafu są opisane stanami we¬ 
wnętrznymi automatu oraz sygnałami wyjściowymi 
automatu. Znaczy to, że w automacie Moore’a 
każdy stan wewnętrzny q s eQ ma przyporządko¬ 
wany sobie tylko jeden sygnał wyjściowy automatu. 
A więc, gdy np. automat znajduje się w stanie q 3 , to 
zgodnie z ryc. 24 na wyjściu automatu mamy sygnał 
wyjściowy y x , bez względu na to, jaki sygnał wej¬ 
ściowy Zj g Z spowodował przejście automatu 
w stan q 3 . 

Omówione automaty skończone typu Mealy’ego 
i Moore’a charakteryzują się zdolnością do pa¬ 
miętania swych stanów wewnętrznych. Automaty, 
które zdolne są do pamiętania swych stanów we¬ 
wnętrznych, noszą nazwę automatów z pamięcią. 
Oprócz nich istnieją automaty bez pamięci, czyli 
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bez zdolności pamiętania swych stanów, i realizujące 
• pewne funkcje przełączające. Dalsze nasze rozwa¬ 
żania ograniczymy tylko do automatów z pamięcią, 
gdyż taki jest automat rozgrywający, będący celem 
niniejszej charakterystyki. 


Elementy struktury automatu skończonego 

Automat skończony jest urządzeniem techni¬ 
cznym mającym odpowiednią strukturę. Struktura 
ta powinna zapewniać działanie automatu zgodnie 
z opisującą to działanie funkcją przejść i wyjść. 

. W strukturze automatu skończonego z pamięcią 
wyróżnia się dwa podstawowe rodzaje elementów: 
elementy logiczne i elementy pamięciowe. 

Elementy logiczne odpowiednio połączone ze sobą 
tworzą jak gdyby pewną sieć przełączającą, natomiast 
elementy pamięciowe tworzą pamięć automatu. 
Strukturę automatu, jak również uwarunkowane tą 
strukturą działanie automatu, można odpowiednio 
opisać korzystając z aparatu formalnego logiki 
matematycznej, a ściślej mówiąc, korzystając tylko 
z jednego z jej działów, noszącego nazwę dwuelemen- 
towej algebry Boole’a. Algebra Boole’a (dwuelemen- 
towa) obejmuje działania logiczne przeprowadzane 
na stałych i zmiennych przyjmujących tylko dwie 
wartości: 1 lub 0, przy czym wyniki działań nad tymi 
wielkościami przyjmują również tylko dwie wartości: 
1 lub 0. Przez analogię do rachunku zdań wartość 
„1” odpowiada wielkości logicznej „prawda”, a war¬ 
tość „0” odpowiada wielkości logicznej „fałsz”. 

W algebrze Boole’a zmienne, nad którymi prze¬ 
prowadza się działania logiczne, noszą nazwę 
zmiennych boolowskich i są oznaczone najczęściej 
małymi literami alfabetu łacińskiego: a , b, c, ..., x, 
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y, z. Spośród szeregu działań logicznych istniejących 
w algebrze Boole’a wyróżnia się trzy podstawowe, 
a mianowicie: sumę logiczną, iloczyn logiczny i ne- 
gację. Działania te mają swoje odpowiednie ozna¬ 
czenia. Na przykład sumę logiczną dwóch zmiennych 
x, y oznacza się symbolicznie * V y, gdzie znak V 
nosi nazwę spójnika logicznego „lub”. Podobnie 
iloczyn logiczny dwóch zmiennych x, y oznacza się 
jako x • y, przy czym znak mnożenia (kropka) nosi 
w tym przypadku nazwę spójnika logicznego „i”; 
bardzo często do oznaczenia spójnika logicznego „i” 
stosuje się również znak A, np. x A y. Natomiast 
negację zmiennej x oznacza się symbolem x, co 
odczytuje się jako „nie x'\ gdyż kreska nad sym¬ 
bolem x wyraża spójnik logiczny „nie”. Wymie¬ 
nione trzy działania logiczne możemy scharakteryzo¬ 
wać przy pomocy następujących tablic 


Tabl. 4 Tabl. 5 


X 

y 

.. 


X 

y 

x*y 

0 

0 

0 


0 

0 

0 

0 

1 

1 


0 

1 

0 

1 

0 

1 


1 

0 

0 

1 

1 

1 


* 

1 

1 


Tabl. 6 



X 

X 

0 

1 

1 

0 


W wierszach tablic reprezentujących sumę i iloczyn 
logiczny podano możliwe kombinacje wartości 
zmiennych x i y oraz odpowiadające tym kombi¬ 
nacjom wartości odpowiednio sumy i iloczynu lo¬ 
gicznego. Z przedstawionych tablic wynika, że 
omawiane działania logiczne przypominają nieco 
działania arytmetyczne, są jednak znacznie od nich 
prostsze. 
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Algebra Boole’a jest teorią aksjomatyczną; oznacza 
to, że w algebrze Boole’a istnieje pewna liczba twier¬ 
dzeń pierwotnych — aksjomatów — na których 
oparte są wszystkie prawa rządzące tą teorią. 

Najbardziej elementarne aksjomaty algebry 
Boole’a przedstawiają się następująco 


dla sumy logicznej 

0 V x = x 
1 V x =1 
x V x = x 
x V x V ... V r ™ x 
x V x — 1 


dla iloczynu logicznego 

0 • x = 0 
1 • x = x 
X • x = X 

V ♦ v • * V = V 

mrV 9TW 1*1 •'V ą/y 

x • x = 0 


Spośród wielu praw algebry Boole’a podstawowe 
znaczenie mają prawa przemienności, łączności, 
rozdzielności i De Morgana. Prawa te przedsta¬ 
wiają się następująco 

Prawo przemienności 

x ■ y = y • x 
xVji=j(Vx 

Prawo łączności 

(x • y) • z = x • (y • z) 

(x V y) V z = * V (y V z) 

Prawo rozdzielności 

* • (y V z) = (x • .y) V (x • z) 
a: V (y • z) = (x V y) • (x V z) 

Prawo De Morgana 
xvy = x • y 

X * y = Jć V y 


10 Teoria gier w cybernetyce 
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W algebrze Boole’a słuszne są te same prawa 
przemienności i łączności, co w zwykłej algebrze, 
ułatwia to znacznie proces przekształcenia wyrażeń 
boolowskich. Wyrażenia boolowskie tworzą zmienne 
boolowskie połączone odpowiednimi spójnikami lo¬ 
gicznymi. Wyrażenia boolowskie możemy odpo¬ 
wiednio przekształcać w celu uzyskania najbardziej 
zminimalizowanej postaci tych wyrażeń. Na przykład 
— korzystając z podanych wyżej aksjomatów — bar¬ 
dzo łatwo udowodnić słuszność następującego prze¬ 
kształcenia 


(x V _y) • (x V z) = X‘x\'x-yVx’zVy-z = 

= x\/x‘yVx’zVyz = 

= X (1 V y V z) V y • z = 

= x V y ’ z 


Działania logiczne sumy, iloczynu i negacji mogą 
być realizowane za pomocą odpowiednich układów 
elektronicznych. Do budowy tych układów wyko¬ 
rzystuje się najczęściej diody półprzewodnikowe, 
tranzystory, rdzenie ferromagnetyczne. Układy elek¬ 
troniczne, realizujące najprostsze operacje logiczne 
sumy, iloczynu, negacji, noszą nazwę elementów 
logicznych, bramek lub funktorów „lub”, „i”, „nie”. 
Dla elementów logicznych realizujących działania 
logiczne zmiennymi boolowskimi są sygnały elek¬ 
tryczne, pojawiające się na odpowiednich przewo¬ 
dach. Sygnały te mają postać odpowiednich impul¬ 
sów prądu lub napięcia. Obecność impulsu w ob¬ 
wodzie może oznaczać wielkość logiczną „1”, a brak 
impulsu w obwodzie może oznaczać wielkość lo¬ 
giczną „0”. Wielkości logiczne 0 i 1 nazywa się po 
prostu w tym przypadku sygnałami 0 i 1 lub bitami 
{bit oznacza elementarną jednostkę informacji). 



Elementy logiczne mają swe odpowiednie ozna¬ 
czenia graficzne, dzięki którym abstrahuje się od ich 
struktury, a rozpatruje się tylko ich funkcjonalność. 
Dla ilustracji na ryc. 25 przedstawiono oznaczenia 



a) b) c) 


Ryc. 25 

elementów logicznych będących funktorami typu 
„lub”, „i” oraz „nie”. Funktor „lub” (ryc. 25 a), 
nazywany również bramką typu „lub”, działa w ten 
sposób, że na jego wyjściu pojawia się sygnał jedyn- 
kowy — tzn. reprezentujący wielkość logiczną 
1 -r- wtedy, gdy co najmniej na jednym z wejść istnieje 
sygnał 1. Wejścia funktora „lub” oznaczone na 
ryc. 25 a symbolami x, y reprezentują zmienne 
boolowskie przyjmujące wartość 0 lub 1 w zależności 
od typu sygnału, jaki pojawia się na danym wejściu. 

Funktor „i” (ryc. 25 b), nazywany często bramką 
typu „i”, działa w ten sposób, że na jego wyjściu 
sygnał 1 pojawia się tylko wtedy, gdy sygnały na 
wszystkich jego wejściach — w rozpatrywanym 
przypadku na wejściach x i y — są równe 1. Bramki 
typu „i”, jak również bramki typu „lub”, mogą mieć 
więcej niż dwa wejścia, przy czym, niezależnie od 
ilości wejść, obowiązują te same zasady logiczne. 
Trzeci podstawowy element logiczny, funktor „nie” 
(ryc. 25 c) nazywany inwertorem, działa w ten spo¬ 
sób, że odwraca sygnał, który jest podawany na 
jego wejście. Jeżeli na wejście przychodzi sygnał 0, 
na wyjściu pojawia się sygnał 1. Podobnie jeżeli na 
wejściu będzie 1, to na wyjściu będzie 0. 


10 * 
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Elementy logiczne „lub”, „i”, „nie” można od¬ 
powiednio ze sobą łączyć. Uzyskuje się w ten sposób 
układ logiczny, który w zależności od liczby funk- 
torów i sposobu ich połączenia realizuje mniej lub 
bardziej złożoną funkcję logiczną, zadaną odpowied¬ 
nim wyrażeniem boolowskim. Funkcję, realizowaną 
przez układ logiczny nazywamy funkcją boolowską 
lub funkcją przełączającą. W ogólnym przypadku 
funkcja przełączająca (boolowską) jest funkcją 
n-argumentową, np. typu f(x u x 2 , ..., x„), charak¬ 
teryzującą się tym, że zarówno ona, jak i jej argu¬ 
menty mogą przyjmować tylko dwie wartości: 0 
lub 1. 

Dla przykładu na ryc. 26 przedstawiono układ 
logiczny realizujący funkcję przełączającą f(*, y, z), 
zadaną wyrażeniem boolowskim x-y Vy-z. Łą¬ 
cząc odpowiednio między sobą proste układy lo¬ 
giczne, takie jak układ z ryc. 26, można otrzymać 



Ryc. 26 


układ logiczny bardziej złożony, o większej liczbie 
wejść i wyjść, a więc układ, który realizuje kilka 
funkcji przełączających. 

Układy zbudowane z elementów logicznych określa 
się często mianem układów kombinacyjnych, gdyż 
przez zmianę kombinacji elementów logicznych 
w tych układach można realizować różne funkcje 
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przełączające. Sygnały na wyjściach układów kom¬ 
binacyjnych są jednoznacznie określone tylko przez 
sygnały pojawiające się na ich wejściach. W ukła¬ 
dach tych nie istnieją żadne zależności od czasu, 
znaczy to, że na sygnał wyjściowy w danej chwili t 
nie mają wpływu sygnały, które pojawiły się na w ej- 
ściu układu w chwili poprzedniej t- 1. 

Układy kombinacyjne są nieodzowną częścią 
składową struktury każdego automatu skończonego, 
gdyż jest on urządzeniem działającym w sposób 
logiczny, a układy kombinacyjne zbudowane z ele¬ 
mentów logicznych zapewniają właśnie takie dzia¬ 
łanie automatu. Układy kombinacyjne tworzą w auto¬ 
macie jak gdyby sieć przełączającą. Sieć ta zapewnia 
właściwy obieg informacji wewnątrz automatu, za¬ 
mykając jedne, a otwierając inne drogi przepływu 
sygnału tak, aby działanie automatu było zgodne 
z opisującą je tablicą przejść i wyjść — dla auto¬ 
matu Mealy’ego, lub oznakowaną tablicą przejść 
— w przypadku automatu Moore’a. 

Drugim rodzajem elementów występujących 
w strukturze automatu skończonego są elementy 
pamięciowe. Elementy pamięciowe tworzą pamięć 
automatu. Pamięć ta służy do zapamiętania stanów 
wewnętrznych automatu, co jest jednoznaczne z pa¬ 
miętaniem przetwarzanej informacji wejściowej. Naj¬ 
bardziej typowym elementem pamięciowym jest 
układ elektroniczny noszący nazwę przerzutnika. 
Przerzutnik stanowi elementarną mikrokomórkę pa¬ 
mięciową i służy do wielokrotnego zapamiętania 
jednobitowej informacji, np. wartości jednej zmiennej 
boolowskiej z jednoczesnym zapamiętaniem negacji 
tej zmiennej. Przerzutnik może znajdować się tylko 
w jednym z dwóch stanów, tj. w stanie 1 lub w stanie 0. 
Przerzutnik jest budowany najczęściej na dwóch 
tranzystorach, ale może być wykonany również na 


149 



rdzeniach ferrytowych lub na innych elementach 
fizycznych. Zasada pracy przerzutnika wykonanego 
na tranzystorach polega na tym, że gdy jeden 
z tranzystorów przewodzi, to drugi jest zatkany 
i w zależności od tego, który z nich przewodzi, mó¬ 
wimy, że przerzutnik znajduje się w stanie 1 lub 0. 

Przerzutnik, podobnie jak wymienione poprzednio 
elementy logiczne, ma swoje odpowiednie oznacze¬ 
nie symboliczne, które przedstawiono na ryc. 27. 
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Ryc. 27 


Przerzutnik jako element pamięciowy posiada dwa 
wyjścia: jedynkowe i zerowe oraz dwa, trzy lub 
tylko jedno wejście. Najczęściej stosuje się prze¬ 
rzutnik z dwoma wejściami rozdzielonymi (ryc. 27 a) 
i przerzutnik z tzw. wejściem zliczającym (ryc. 27 b). 
Najpierw rozpatrzymy przerzutnik z dwoma wejś¬ 
ciami rozdzielonymi. Na wejścia tego przerzutnika 
przykładane są sygnały zero-jedynkowe. Sygnał jedyn- 
kowy reprezentowany jest dodatnim impulsem na¬ 
pięcia, a sygnał zerowy — ujemnym impulsem na¬ 
pięcia lub zerowym napięciem. Sygnał jedynkowy 
nosi w tym przypadku nazwę sygnału wyzwalającego. 
Pojawianie się tego sygnału na wejściu jedynkowym 
powoduje, że przerzutnik przechodzi w stan 1 i znaj- 
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duje się w nim dotąd, aż z kolei na wejściu zerowym 
nie pojawi się sygnał jedynkowy. Pojawienie się 
sygnału jedynkowego na wejściu zerowym powoduje 
przejście przerzutnika ze stanu 1 w stan 0. Jeżeli 
przerzutnik znajduje się w stanie 1, to na jego wyjściu 
jedynkowym istnieje wysoki poziom potencjału, 
reprezentujący sygnał potencjałowy 1; jeżeli prze¬ 
rzutnik znajduje się w stanie 0, to na jego wyjściu 
jedynkowym istnieje niski poziom potencjału, przed¬ 
stawiający sygnał potencjałowy 0. Gdy przyjmiemy, 
że stan przerzutnika reprezentuje wartość zmiennej 
boolowskiej q, to w stanie 1 na wyjściu jedynkowym 
przerzutnika istnieje sygnał q = 1, a w stanie 0 
— sygnał q — 0. 

* Drugi typ przerzutnika działa w ten sposób, że 
każdy kolejny impuls jedynkowy pojawiający się 
na wejściu zmienia stan przerzutnika na przeciwny. 
Jeżeli więc stanem początkowym przerzutnika jest 
stan 0, to pierwszy impuls jedynkowy powoduje 
przejście przerzutnika w stan 1, drugi impuls w stan 0, 
trzeci impuls w stan 1 itd. Ze względu na działanie 
przerzutników tego typu używa się do budowy 
liczników binarnych, tj. liczników służących do 
zliczania impulsów jedynkowych pojawiających się 
na wejściu danego układu, przy czym liczbę 
zliczanych impulsów wyraża się wówczas liczbą 
dwójkową (binarną). 

W automacie skończonym do zapamiętania stanów 
wewnętrznych automatu najczęściej są wykorzy¬ 
stywane przerzutniki z dwoma wejściami rozdzie¬ 
lonymi. Wykorzystane do tego celu przerzutniki 
noszą nazwę automatów elementarnych i jako takie 
są automatami typu Moore’a. Uzasadnione jest to 
tym, że przerzutnik może znajdować się w jednym 
z dwóch stanów wewnętrznych, które jednoznacznie 
określają sygnały wyjściowe, a więc jest automatem 
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Moore’a. Zbiór automatów elementarnych (prze- 
rzutników) w automacie skończonym stanowi pa¬ 
mięć automatu. W pamięci tej stany wewnętrzne 
określonej grupy automatów elementarnych określają 
stan wewnętrzny danego automatu skończonego. 

Przerzutniki jako elementy pamięciowe oraz 
omówione już wyżej elementy logiczne są podsta¬ 
wowymi cegiełkami struktury automatu skończonego. 
Ze względu na te dwa podstawowe rodzaje elemen¬ 
tów, w strukturze automatu skończonego wyodręb¬ 
nia się dwie części składowe: część pamięciową 
i część kombinacyjną. Schemat blokowy automatu 
z uwzględnieniem tych dwóch części został przed¬ 
stawiony na ryc. 28. Widzimy, że część kombina- 
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cyjna jest; jak gdyby! siecią! sprzężeń jzwrotnych 
automatu, zapewniającą jego właściwe funkcjono¬ 
wanie zgodnie z opisującymi go funkcjami wejść 
wyjść. Zadanie związane z określeniem dokładnej 
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struktury konkretnego automatu nosi nazwę syntezy 
strukturalnej, lecz wykracza ona poza ramy niniej¬ 
szej książki. 


Działanie i struktura automatu rozgrywającego 

Pod terminem „automat rozgrywający” bę¬ 
dziemy rozumieć taki automat skończony, który 
działa zgodnie z regułami dwuosobowej gry wielo- 
chodowej. W interesujących nas problemach stero¬ 
wania, opisywanych modelem matematycznym gry 
wielochodowej, automat rozgrywający reprezentuje 
jedną ze stron gry, a więc rozgrywa grę na korzyść 
jednego z graczy. Na przykład w procesie stero¬ 
wania systemem automat rozgrywający, jako gracz A, 
będzie reprezentował organ sterujący systemu, na¬ 
tomiast graczem B będzie pozostała, sterowana 
część systemu z uwzględnieniem pewnych własności 
otoczenia. W automacie rozgrywającym zbiorem 
sygnałów wejściowych automatu jest zbiór wszyst¬ 
kich możliwych strategii chodowych strony B gry. 
Podobnie zbiorem sygnałów wyjściowych tego auto¬ 
matu jest zbiór wszystkich możliwych strategii 
chodowych strony A gry. Zbiory te, oznaczone sym¬ 
bolami Z i Y, mają postać określoną wyrażeniem 
(5.1) i (5.2). 

Podstawowym zadaniem automatu rozgrywającego 
jest wypracowywanie optymalnych strategii chodo¬ 
wych dla gracza A. Sygnał wyjściowy automatu 
rozgrywającego y t e Y, reprezentujący strategię 
chodową gracza A, zależy od aktualnej sytuacji 
powstałej w procesie realizacji gry po ostatnim 
poprzedzającym tę sytuację ruchu wykonanym przez 
gracza B. Sytuacja powstała w grze wielochodowej, 
jak już wiadomo, reprezentuje sekwencję doko- 
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nanych przez graczy wyborów strategii chodowych 
we wszystkich ruchach poprzedzających tę sytuację. 
Wiadomo również, że automat rozgrywający po¬ 
winien działać zgodnie z jednostronnie zoptyma¬ 
lizowanym na korzyść gracza A dendrytem danej 
gry wielochodowej. W celu zapewnienia takiego 
działania, każdej sytuacji, która powstała w grze 
po ruchu wykonanym prźez gracza B, powinien być 
przyporządkowany odpowiedni stan wewnętrzny 
automatu. Wszystkie możliwe stany wewnętrzne 
automatu tworzą zbiór stanów wewnętrznych Q 
o postaci zadanej wyrażeniem (5.3) — zbiór ten 
rzutuje na pamięć automatu. 

Automat rozgrywający, podobnie jak każdy inny 
automat skończony, działa w dyskretnych chwilach 
ti, t 2 , ..., tj, ...,. W tym przypadku chwile ozna¬ 
czają te momenty czasu, w których gracz B wykonuje 
w grze poszczególne swoje ruchy. Ponieważ każdy 
ruch gracza B zapoczątkowuje kolejne posunięcie 
w grze, celowo jest zastąpić dyskretne chwile nume¬ 
rami porządkowymi kolejnych posunięć w grze. 
Symbolem kolejnych posunięć w grze jest więc 
liczba naturalna n — 1, 2 , ..., m. 

Działanie automatu rozgrywającego najdogodniej 
jest wyrazić następującą parą funkcji przejść i wyjść 

Q(n + 1) = ¥[?(»), z(n +1)] (5.8) 

y(ń) = <S>[q(n )] (5.9) 

gdzie: q{ń) — stan wewnętrzny automatu po po¬ 
sunięciu n, 

z(n + 1) — sygnał na wejściu automatu w posu¬ 
nięciu n + 1, 

y(n) — sygnał na wyjściu automatu po posu¬ 
nięciu n. 


154 



Zgodnie z przedstawioną funkcją wyjść, sygnał 
wyjściowy automatu X”) 6 P° posunięciu n, 

nie zależy od sygnału wejściowego, lecz tylko od 
stanu wewnętrznego automatu po posunięciu n. 
Ze względu na tak zadaną funkcję wyjść, automat 
rozgrywający jest automatem typu Moore’a. 

Jak wiadomo, graficznym obrazem działania 
automatu skończonego jest graf automatu. Ponieważ 
algorytm działania automatu rozgrywającego jest 
zawarty w opisie jednostronnie zoptymalizowanego 
dendrytu gry, graf automatu rozgrywającego od¬ 
zwierciedla strukturę jednostronnie zoptymalizowa¬ 
nego dendrytu gry. Przykładowy graf automatu 
rozgrywającego został przedstawiony na ryc. 29 



i, jak to widać z rysunku, opis wierzchołków i krawę¬ 
dzi tego grafu jest zgodny ze sposobem opisu grafu 
automatu Moore’a (por. ryc. 24). Krawędzie grafu 
automatu rozgrywającego, opisane elementami z 3 e Z, 
reprezentują strategie chodowe gracza B i jedno¬ 
cześnie sygnały wejściowe automatu, natomiast wierz¬ 
chołki grafu odpowiadają stanom wewnętrznym 
automatu i wyrażają sytuacje w grze. Każdemu 
wierzchołkowi grafu, z wyjątkiem wierzchołka po- 


155 



czątkowego, jest przyporządkowany sygnał wyjściowy 
automatu y t e Y, będący strategią chodową gracza A 
w sytuacji określonej danym wierzchołkiem. Wierz¬ 
chołek początkowy grafu, oznaczony symolem q °, 
określa stan początkowy automatu; w stanie tym, 
odpowiadającym sytuacji początkowej w grze, auto¬ 
mat nie generuje żadnego sygnału wyjściowego. 

Ze względu na wyraźne podobieństwo struktury 
grafu automatu rozgrywającego do odpowiadającego 
mu jednostronnie zoptymalizowanego dendrytu gry, 
ten ostatni można potraktować jako graf automatu, 
po uprzednim opisaniu każdego wierzchołka typu 2?" 
w dendrycie odpowiednim stanem wewnętrznym 
automatu. Opisany w powyższy sposób jednostronnie 
zoptymalizowany dendryt gry, reprezentujący graf 



automatu, został przedstawiony poglądowo na ryc. 30. 
Zgodnie z tym rysunkiem, wierzchołek początkowy 
dendrytu, oznaczony symbolem B\, jest jednocześnie 
stanem początkowym automatu q\. Z chwilą poja- 
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wienia się na wejściu automatu sygnału z s , automat 
przechodzi ze stanu początkowego q° l w stan q\, 
a następnie, znajdując się już w stanie q\, generuje sy¬ 
gnał wyjściowy y 3 . Podobnie, gdy w stanie q° l 
na wejściu automatu pojawi się 1 sygnał z 7 lub z l0 , 
automat przechodzi ze stanu q° x odpowiednio w stan 
q\ lub q\ i generuje sygnał y n lub y s . 

Przy rozpatrywaniu jednostronnie zoptymalizo¬ 
wanego dendrytu gry jako grafu automatu pomija 
się wierzchołki A”, a elementy y t opisujące krawędzie 
wychodzące z tych wierzchołków przyporządkowuje 
się umownie tym wierzchołkom B”, do których te 
krawędzie dochodzą. Na przykład element y 3 opisu¬ 
jący krawędź wychodzącą z wierzchołka A\ należy 
przyporządkować umownie wierzchołkowi B\, który 
reprezentuje stan wewnętrzny automatu q\. 

Oznaczenia wierzchołków typu J?" jednostronnie 
zoptymalizowanego dendrytu gry dokonuje się 
w procesie syntezy strukturalnej automatu rozgry¬ 
wającego. Synteza strukturalna obejmuje wszystkie 
czynności związane z określeniem struktury auto¬ 
matu rozgrywającego. Przeprowadzenie syntezy 
strukturalnej automatu rozgrywającego jest na ogół 
zagadnieniem złożonym. Punktem wyjściowym tej 
syntezy jest jednostronnie zoptymalizowany na ko¬ 
rzyść automatu (gracza A) dendryt danej gry wielo- 
chodowej. Proces syntezy sprowadza się do operacji 
logicznych na zbiorach symboli opisujących krawę¬ 
dzie i wierzchołki jednostronnie zoptymalizowanego 
dendrytu gry. Zbiory te zwykle dzieli się na odpo¬ 
wiednie podzbiory, według ściśle określonych kry¬ 
teriów tego podziału, np. podział zbioru Z według 
pięter dendrytu (por. wyrażenie 3.3). Celem tych 
operacji jest określenie stanów wewnętrznych auto¬ 
matu oraz funkcji przełączających wejść i wyjść 
automatu. 
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Na wielu przykładach przeprowadzenia syntezy 
strukturalnej automatów rozgrywających można 
stwierdzić, że struktura tego typu automatu skoń¬ 
czonego powinna odzwierciedlać w jak największym 
stopniu strukturę jednostronnie zoptymalizowanego 
dendrytu gry. Stąd też automat rozgrywający jest 
automatem wielostopniowym mającyiri tyle stopni, 
ile wynosi liczba pięter dendrytu gry, do której 
rozgrywania automat jest przeznaczony. Każdy 
stopień automatu wielostopniowego składa się z ele¬ 
mentów pamięciowych (przerzutników), określają¬ 
cych stan wewnętrzny automatu danego stopnia, 
i elementów logicznych, realizujących funkcje prze¬ 
łączające. Automat danego stopnia n jest automatem 
jednostopniowym i przyporządkowany jest n-temu 
piętru dendrytu gry. 

W procesie realizacji gry automat danego stopnia n 
może przejść ze stanu zerowego q£ tylko do jednego 
ze swych stanów roboczych objętych zbiorem 

Qn = {q\, q\, q ?,.... q”) (5.10) 

Każdy stan wewnętrzny q " e Q n automatu jedno- 
stopniowego, stopnia n, ma przyporządkowany sobie 
w postaci przerzutnika oddzielny element pamię¬ 
ciowy oznaczony symbolem <q? >. Element pamię¬ 
ciowy <q" > może znajdować się w stanie 0 lub w sta¬ 
nie 1. Jeżeli w trakcie pracy automatu rozgrywa¬ 
jącego, po posunięciu n, element <q”> znajduje się 
w stanie 1, oznacza to, że element <q”> jest elemen¬ 
tem wyróżnionym w strukturze automatu stopnia n , 
a stan tego automatu jest q”. 

Wyróżniony element pamięciowy automatu «-tego 
stopnia określa jego aktualny stan wewnętrzny, 
który przyporządkowany jest jednemu lub kilku¬ 
nastu naraz wierzchołkom B” n-tego piętra jedno- 
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stronnie zoptymalizowanego dendrytu gry. Dla przy¬ 
kładu rozpatrzmy jednostronnie zoptymalizowany 
dendryt gry przedstawiony na ryc. 30, gdzie po¬ 
kazano tylko dwa piętra dendrytu. Dla tego den¬ 
drytu automaty jednostopniowe stopnia n — 1 
i n = 2 posiadają następujące zbiory stanów 'we¬ 
wnętrznych 

0 i = {q\, q l 2> Qł} 

02 = {q\, q\, qł] 

W pierwszym piętrze dendrytu każdemu elemen¬ 
towi <7* (r = 1, 2, 3) przyporządkowany jest tylko 
jeden wierzchołek typu 2?*. Natomiast inaczej to wy¬ 
gląda w drugim piętrze dendrytu, a mianowicie 
stan q\ przyporządkowany jest wierzchołkom B\, 
B\, B%, stan q\ — wierzchołkom B\, Bi i stan 
q\ — wierzchołkom B\, B 2 . Podobny sposób przy¬ 
porządkowania elementów q" wierzchołkom B* 
obowiązuje również w wyższych piętrach dendrytu 
(nie przedstawionych na ryc. 30). Przejście automatu 
danego stopnia n ze stanu początkowego q n 0 
do jednego z jego stanów roboczych q " uwarunko¬ 
wane jest pojawieniem się w posunięciu n na wejściu 
automatu wielostopniowego ściśle określonego sy¬ 
gnału wejściowego z 3 e Z. Zgodnie z regułami pro¬ 
wadzenia gry wielochodowej, w danym posunię¬ 
ciu n na wejściu automatu rozgrywającego może 
pojawić się tylko jeden sygnał z 3 , reprezentujący 
strategię chodową gracza B i należący do zbioru 
Z" <= Z. 

Zbiór Z", zgodnie z wyrażeniem (3.4), obejmuje 
takie strategie chodowe gracza B, które są dopusz¬ 
czalne do wykonania w n-tym posunięciu. W zbio¬ 
rze Z" można wyróżnić te elementy z 3 , które przy 
pojawieniu się ich w posunięciu n na wejściu auto- 


159 



matu wielostopniowego powinny powodować przej¬ 
ście automatu stopnia n ze stanu q n 0 zawsze w jeden 
i ten sam stan roboczy q ". Wyróżnione w ten sposób 
elementy z } stanowią pewien podzbiór zbioru Ż" 
przyporządkowany stanowi wewnętrznemu q". Na 
przykład dla dendrytu z ryc. 30 mamy 

Z 2 = {z u z 2 , z 3 , z 4 , z 6 }‘ 

W zbiorze tym elementy z lf z 2 , z 4 warunkują przejście 
automatu stopnia n = 2 w stan q\, co ozna¬ 
czymy symbolicznie 

{z l9 z 2 , z 4 } =4 q\ 

Podobnie dla pozostałych elementów zbioru Z 2 
mamy: {z 6 } => q\, {z 3 } => q\. W celu zapewnienia 
właściwego działania automatu wielostopniowego, 
w skład każdego takiego podzbioru może wejść co 
najwyżej tyle elementów z 3 e Z", ile jest zbiorów S” 
w piętrze n jednostronnie zoptymalizowanego den¬ 
drytu gry (zbiór S" zdefiniowany został w rozdziale 3 
— wyrażenia 3.5 i 3.6). Dodatkowym warunkiem 
jest to, że z każdego zbioru Sf może wejść do danego 
podzbioru {z Jt , z j2 ,...,} => q? nie więcej niż jeden 
element Zj e S". 

Stąd też w celu jednoznacznego określenia stanów 
wewnętrznych automatu stopnia n należy każdemu 
elementowi z s danego zbioru Sf przyporządkować 
inny stan wewnętrzny qf e Q„. Dla dendrytu gry 
z ryc. 30 warunek ten jest spełniony, co łatwo jest 
sprawdzić, analizując drugie piętro dendrytu. 

W procesie realizacji gry przez automat rozgry¬ 
wający automaty jednostopniowe poszczególnych 
stopni pracują w kolejności określonej numerem 
porządkowym stopnia n. Zgodnie z tym, w posu¬ 
nięciu n = 1 przechodzi w odpowiedni stan roboczy 
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automat stopnia n = 1, w posunięciu n — 2 automat 
stopnia n = 2 itd. 

Aktualne w danym momencie czasu stany we¬ 
wnętrzne automatów poszczególnych stopni określają 
jednoznacznie stan wewnętrzny automatu wielo¬ 
stopniowego (rozgrywającego). Stan wewnętrzny 
automatu wielostopniowego po danym posunięciu n 
jest więc funkcją stanów wewnętrznych automatów 
poszczególnych stopni do stopnia n włącznie. 
Oznaczając symbolem F(ń) stan wewnętrzny auto¬ 
matu wielostopniowego po posunięciu n, a symbolem 
q(k) stan wewnętrzny automatu jednostopniowego 
o stopniu fc, funkcję tę możemy wyrazić następująco 

F(n) = /[<?( 1), ?(2), ..., q(k), ..., <?(«)] (5.11) 

Stan F(ri) jednoznacznie określa sygnał y(n) po¬ 
jawiający się na wyjściu automatu wielostopniowego 
po posunięciu n. Sygnał y(n) przyjmuje więc swoje 
wartości ze zbioru Y zgodnie z następującą funkcją 

y(n) - <p[F(n)] (5.12) 

Obie podane wyżej funkcje noszą odpowiednio 
nazwy funkcji przejść i funkcji wyjść automatu 
wielostopniowego. Funkcje te swoją postacią różnią 
się tym od funkcji zadanych wyrażeniami (5.8) i (5.9), 
że uwzględniają wielostopniową strukturę automatu 
rozgrywającego, odpowiadającą strukturze jedno¬ 
stronnie zoptymalizowanego dendrytu gry. Zgodnie 
z funkcją przejść każdy stan wewnętrzny automatu 
wielostopniowego przyporządkowany jest tylko 
jednemu wierzchołkowi typu B” jednostronnie 
zoptymalizowanego dendrytu gry. Na przykład dla 
dendrytu gry przedstawionego na ryc. 30 
wierzchołek B\ reprezentuje stan wewnętrzny 
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F\ = q\ q\, wierzchołek B\ — stan F\ = q\ q\, 
wierzchołek B 2 7 — stan F 2 — q\ q\ itd. Stan 
wewnętrzny automatu wielostopniowego po posu¬ 
nięciu n = 2 reprezentowany jest więc dwuelemen- 
towym ciągiem, w którym pierwszym elementem 
jest aktualny stan wewnętrzny automatu stopnia 
n — 1 , a drugim — aktualny stan wewnętrzny auto¬ 
matu stopnia n = 2. 

Analogicznie stan wewnętrzny automatu wielo¬ 
stopniowego dla większej wartości n można wy¬ 
razić ciągiem 

FJ = qh q\ - , q r \ (5.13) 

W automacie rozgrywającym o strukturze, wielo¬ 
stopniowej, podobnie jak w dowolnie innym auto¬ 
macie z pamięcią, wyróżnia się dwie podstawowe 
części funkcjonalne, tj. część pamięciową i część 
kombinacyjną. Część pamięciową tworzą elementy 
pamięciowe automatów poszczególnych stopni, a część 
kombinacyjną tworzą elementy logiczne bądź to 
podporządkowane automatom poszczególnych stopni, 
bądź to wspólne dla wszystkich automatów jedno- 
stopniowych. 

Część kombinacyjna automatu rozgrywającego jest 
rozbudowanym układem logicznym realizującym od¬ 
powiednie funkcje przełączające (boolowskie). 
W automacie rozgrywającym o strukturze wielo¬ 
stopniowej możemy wyróżnić dwa rodzaje funkcji 
przełączających, opisujących układ logiczny auto¬ 
matu. Są to funkcje przełączające wejść automatów 
poszczególnych stopni oraz funkcje wyjść automatu 
wielostopniowego. Każdy automat jednostopniowy 
wchodzący w skład automatu wielostopniowego 
posiada tyle funkcji przełączających wejść, ile wynosi 
liczba jego stanów wewnętrznych. Dowolna funkcja 
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przełączająca wejść automatu jednostopniowego 
danego stopnia n opisuje układ logiczny realizujący 
przejście automatu jednostopniowego ze stanu zero¬ 
wego q% do jednego, ściśle określonego stanu robo¬ 
czego q? e Q n . 

Funkcja taka ma postać 


W™ z Jlt ...,)] = 

= ń„ • (z Jl V Zj2 V ...) =s> q? 


(5.14) 


W wyrażeniu tym symbol ń n jest zmienną boolowską 
reprezentującą sygnał wystąpienia w grze posunię¬ 
cia n. Zmienna ń„ przyjmuje wartość ń n = 1, gdy 
posunięcie n wystąpiło, i wartość ń n = 0, gdy po¬ 
sunięcie n nie wystąpiło. Natomiast symbole z Jx , z Ji} ... 
oznaczają ściśle określane sygnały wejściowe auto¬ 
matu wielostopniowego, przynależne do zbioru 
Z” <= z. Sygnał jedynkowy pojawiający się na wyj¬ 
ściu układu logicznego, opisanego wyrażeniem (5.14), 
powoduje przejście w stan 1 tylko przerzutnika <q? >, 
który będąc w stanie 1 sygnalizuje stan q? — stąd 
też dla oznaczenia takiego przyporządkowania za¬ 
stosowano w wyrażeniu symbol =>. 

Drugim rodzajem funkcji przełączających opisu¬ 
jących strukturę logiczną automatu wielostopnio¬ 
wego są funkcje przełączające wyjść. Wyjścia auto¬ 
matu wielostopniowego opisane są elementami y t 
zbioru Y zawierającego strategie chodowe gracza A. 
Sygnał pojawiający się na danym wyjściu opisanym 
symbolem y t jest sygnałem wyjściowym y if który 
reprezentuje ściśle określoną strategię chodową gra¬ 
cza A. Sygnał wyjściowy y u zgodnie z wyrażeniem 
y(n) = <p[F(n)], jest zależny od stanu wewnętrznego 
automatu wielostopniowego. W zbiorze możliwych 
stanów wewnętrznych automatu wielostopniowego 
możemy wybrać te stany, z których każdy warunkuje 
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sobą jeden i ten sam sygnał wyjściowy y t . Z kolei 
każdy stan wewnętrzny automatu wielostopniowego, 
zgodnie z wyrażeniem (5.13), możemy potraktować 
jako iloczyn logiczny wyróżnionych stanów wewnę¬ 
trznych automatów poszczególnych stopni. Stąd też 
dla każdego y t e Y można określić odpowiednie 
wyrażenia boolowskie reprezentujące funkcję prze¬ 
łączającą typu y t — cp([F(n)], tj. przyporządkowaną 
danemu wyjściu y t . Funkcja taka opisuje sobą układ 
logiczny doprowadzający sygnał z wyjść jedynkowych 
określonych elementów pamięciowych na wyjście 
y L automatu wielostopniowego. 

Dla uzyskania pewnego wglądu w strukturę auto¬ 
matu rozgrywającego, na ryc. 31 przedstawiono 
schemat funkcjonalny tego automatu dla gry koń¬ 
czącej się po trzech posunięciach (tj. dla n max = 
= m = 3). Elementem sterującym pracą automatu 
rozgrywającego jest licznik kolejnych posunięć w grze, 
oznaczony na schemacie jako „licznik n”. Licznik n 
jest licznikiem binarnym, tzn. wynik liczenia pamię¬ 
tany jest w liczniku w postaci liczby dwójkowej, 
reprezentowanej odpowiednią kombinacją zerojedyn¬ 
kową. Stan licznika n określa numer kolejnego 
posunięcia w grze. W momencie wykonania przez 
gracza B kolejnego ruchu, rozpoczynającego nowe 
posunięcia w grze, na jednym z wejść „z,” automatu 
pojawia się dodatni impuls napięcia odpowiadający 
sygnałowi 1. Sygnał ten poprzez bramki wejściowe 
licznika trafia na jego wejście zliczające. 

Stan licznika powiększa się o jeden i wskazuje 
aktualny numer porządkowy posunięcia w grze. 
Zmieniony stan licznika powoduje pojawienie się 
sygnału jedynkowego na ściśle określonym i tylko 
jednym wyjściu deszyfratora licznika, a mianowicie 
na takim wyjściu deszyfratora, którego numer po¬ 
rządkowy odpowiada aktualnemu stanowi licznika. 
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WYJŚCIE 




Ryc. 31 


Sygnał ten, reprezentujący aktualną 
otwiera odpowiednie bramki znajdując 
dach wejściowych i wyjściowych ar 
wającego. Jednocześnie sygnał Zj o 
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automatu podawany jest, poprzez przyporządko¬ 
wany sobie obwód wejściowy i otwartą sygnałem „n” 
bramkę, na jeden z przerzutników automatu stopnia n 
i powoduje jego przejście w stan 1. W wyniku tego 
następuje zmiana stanu wewnętrznego automatu 
wielostopniowego, pociągająca za sobą, pojawienie 
się na jego wyjściu określonego sygnału y t e Y. 

W automacie jednostopniowym ostatniego stopnia, 
w rozpatrywanym przypadku dla n — 3, z reguły nie 
znajdują się elementy pamięciowe. Dla ostatniego 
posunięcia w grze stan automatu wielostopniowego 
określany jest przez sygnał z } w tym posunięciu 
i przez wyróżniane stany automatów jednostopnio- 
wych wszystkich niższych stopni (tj. stopni n = 1, 
n = 2). 

W przedstawionej charakterystyce automatu roz¬ 
grywającego nie uwzględniono zagadnienia mini¬ 
malizacji struktury automatu. W wyniku zastoso¬ 
wania takiej minimalizacji, niektóre elementy pa¬ 
mięciowe stają się wspólne dla automatów jedno- 
stopniowych kilku stopni, co w pewnym sensie 
zniekształca dendrytową strukturę automatu roz¬ 
grywającego. 



6 

Gra w szachy w świetle cybernetyki 

Szachy — problem cybernetyczny 

Najbardziej udanym modelem odniesienia dla 
wielu problemów, dających się opisać postacią 
dwuosobowej gry wielochodowej i rozpatrywanych 
w cybernetyce z punktu widzenia procesów stero¬ 
wania, jest niewątpliwie gra w szachy. Znaczenie tej 
gry jako pewnego modelu odniesienia uzasadnione 
jest m.in. pozycją, jaką gra ta zajmuje w teorii gier. 

Teoria gier, poświęcona formalnemu ujęciu sy¬ 
tuacji konfliktowych, wyrosła na gruncie istniejących 
gier towarzyskich, wśród których gra w szachy ze 
względu na swą złożoność zajmowała i nadal zajmuje 
szczególną pozycję, chociażby dlatego, że do tej pory 
gra ta nie została rozwiązana. Szereg problemów 
sterowania, rozpatrywanych w cybernetyce i wyka¬ 
zujących cechy sytuacji konfliktowych, kojarzy się 
swą złożonością z grą w szachy. Stąd też grę w szachy 
można potraktować jako uogólniony model pewnego 
procesu fizycznego, dającego się opisać postacią 
dwuosobowej gry wielochodowej. Rozpatrywanie 
problemu automatycznego sterowania tym procesem, 
z punktu widzenia interesów jednego z graczy, po¬ 
zwala na wyciągnięcie wniosków, dotyczących wy¬ 
korzystania automatów rozgrywających do opty¬ 
malnego sterowania działaniem systemów z zacho- 
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waniem celowym. Ponadto należy zwrócić uwagę 
na to, że gra w szachy jest jedną z najbardziej skom¬ 
plikowanych gier, jakie wynalazła ludzkość, a tym 
samym jest odzwierciedleniem zdolności umysłu 
ludzkiego, i że ze względu na swą złożoność i stopień 
skomplikowania gra ta znajduje się w sferze zagad¬ 
nień rozpatrywanych w cybernetyce. 

Ponieważ w aspekcie historycznym rozwój cy¬ 
bernetyki jako nauki pokrywa się z rozwoiem 
elektronicznych maszyn cyfrowych jako urządzeń 
genezy zainteresowania się tym problemem należy 
szukać w pracach związanych z analizą możliwości 
obliczeniowych maszyn cyfrowych. 

Od czasu uruchomienia pierwszych elektronicz¬ 
nych maszyn cyfrowych naukowców po prostu 
fascynowało pytanie, czy maszyna cyfrowa jest zdolna 
grać w szachy i w jakim stopniu. Jak wiadomo, 
maszyna cyfrowa działa według ściśle określonego 
programu wprowadzonego do jej pamięci, dlatego 
też, aby mogła ona grać W szachy, należy ją odpo¬ 
wiednio zaprogramować. Z drugiej strony wiadomo 
jednak, że zgodnie z obliczeniami Claude Shannona 
istnieje aż 10 120 możliwych wariantów rozegrania 
gry w szachy. Jakkolwiek więc ułożenie programu 
optymalnego postępowania maszyny cyfrowej w pro¬ 
cesie realizacji gry w szachy jest możliwe, jednak 
jego realizacja — przy istnieniu tak olbrzymiej 
liczby wariantów rozegrania gry w szachy — jest 
niemożliwa dla współczesnych maszyn cyfrowych. 
Wynika to z tego, że przed wykonaniem dowolnego 
ruchu maszyna cyfrowa musiałaby przeanalizować 
wszystkie możliwe dalsze ruchy, konsekwencje tych 
ruchów oraz uwarunkowane nimi konfiguracje figur 
na szachownicy. 

Przy ograniczonej szybkości działania współ¬ 
czesnych maszyn cyfrowych, która maksymalnie 
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tT a 0 nil^ 0ł t° ^ 10 1 T ra l ^ SekUnd ?’ P roces 
tej analizy trwałby bardzo długo, a w niektórych 

przypadkach nawet kilka lat. Stąd też do dzik¬ 
szego dnia me ma maszyn cyfrowych grających 
w Czachy w sposób optymalny, tzn. w taki sposób 
który zapewniałby maszynie cyfrowej uzyskanie 
pewnej wygranej przy prowadzeniu gry z dowolnym 
rozumnym przeciwnikiem lub, w najgorszym dla 
niej przypadku, osiągnięcie remisu. Pojawiające się 
od czasu do czasu w różnych czasopismach w zmianki 
o omputerach grających w szachy dotyczą maszyn 
cyfrowych, grających w szachy według metod heury¬ 
stycznych, Metody heurystyczne oparte są na przyj¬ 
mowaniu pewnych prawdopodobnych hipotez 
o słuszności wykonywanych ruchów. Przy prowadze¬ 
niu gry w szachy według metod heurystycznych ist¬ 
nieje zawsze prawdopodobieństwo, że maszyna cyfro¬ 
wa może przegrać nawet z początkującym szachistą. 

Historia układania programów szachowych dla 
maszyn cyfrowych i praktycznego wykorzystania 
na podstawie tych programów — maszyn cyfro¬ 
wych do prowadzenia gry w szachy, w układzie 
człowiek—komputer bądź też w układzie komputer— 
-komputer, jest już dość bogata w fakty. Historia 
ta rozpoczyna się od artykułu Claude Shannona, 
opublikowanego w 1949 r. i dotyczącego zagadnienia 
programu szachowego. Jednak w artykule tym 
Shannon nie przedstawił konkretnego programu 
lecz omowił tylko szereg podstawowych zasad do¬ 
tyczących układania takiego programu. Koncepcje 
Shannona sprowadzały się do tego, że w celu uło¬ 
żenia programu szachowego w procesie prowadze¬ 
nia gry w szachy należy wyróżnić następujące czyn¬ 
ności, rozpatrzenie wszystkich możliwych w danej 
sytuacji ruchów, analiza tych ruchów, wybór naj¬ 
lepszego ruchu na podstawie otrzymanych ocen. 
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Według Shannona analizę ruchów figur na sza¬ 
chownicy przeprowadza się w celu otrzymania pewnej 
efektywnej oceny każdego możliwego ruchu z danej 
pozycji. Łączy się to z rozpatrzeniem możliwych 
wariantów rozegrania gry z danej pozycji o kilka 
posunięć w przód, tj. do pewnej określonej głębokości 
w rozgrywanej partii. Rozpatrywanie wariantów 
rozegrania gry z danej pozycji, aż do sytuacji będącej 
zakończeniem gry, tj. na całą głębokość, jest nie¬ 
możliwe ze względu na olbrzymią liczbę możliwych 
wariantów kontynuowania gry z danej pozycji. Stąd 
też, w trakcie analizy sytuacje znajdujące się na danej 
głębokości są oceniane na podstawie rozmieszczenia 
figur na szachownicy. 

Wynikiem analizy możliwych ruchów figury 
z danej pozycji są pewne oceny liczbowe odnoszące 
się do każdego ruchu figury z tej pozycji — oczy¬ 
wiście ruch z najwyższą oceną jest najlepszy. Należy 
jednak zauważyć, że w danej sytuacji powstałej na 
szachownicy analizie podlegają nie tylko ruchy 
jednej określonej figury, ale wszystkich tych figur, 
które w danej sytuacji mają możliwość ruchu, a więc 
nie są blokowane. Na podstawie porównania otrzy¬ 
manych z analizy ocen ruchów figur nie blokowanych 
wykonuje się ruch, który ma ocenę najwyższą i do¬ 
tyczy określonej figury. 

Według koncepcji Shannona kryteria oceny ruchów 
figur, pozycji i konfiguracji figur na szachownicy 
opierają się na metodach heurystycznych, przy czym 
do oceny takiej należy wykorzystywać pewne dane 
statystyczne, zebrane na podstawie analizy partii 
szachów rozegranych przez najlepszych szachistów 
świata. 

Koncepcje Shannona stały się podstawą więk¬ 
szości późniejszych konkretnych programów sza¬ 
chowych. Do bardziej znanych programów szacho- 
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wych — programów heurystycznych — należy za¬ 
liczyć program Turinga (1950), program Bernsteina 
(1958) oraz program Newella, Shawa i Simona (1958). 
Układaniem programów szachowych zajmowali się 
również czołowi szachiści, byli mistrzowie świata, 
jak Max Euwe (Holandia) i Michał Botwinnik 

J* 

Na przykład Botwinnik opracował algorytm gry 
w szachy do wykorzystania na maszynie cyfrowej, 
który charakteryzuje się tym, że jest odzwierciedle¬ 
niem stosowanych przez niego metod prowadzenia gry 
w szachy. Algorytm ten został opublikowany 
w 1968 r. w języku rosyjskim i w 1970 r. w języku 
angielskim. Na podstawie algorytmu Botwinnika 
opracowany został program szachowy dla maszyny 
cyfrowej M-220. 

Wszystkie wymienione programy szachowe są 
dalekie od doskonałości, gdyż gra komputerów 
wykorzystujących te programy przebiega na poziomie 
przeciętnego szachisty amatora. Do najgłośniejszych 
meczy szachowych rozegranych przez komputery 
należy zaliczyć międzynarodowy mecz szachowy, 
który odbył się w 1967 r. między komputerem amery¬ 
kańskim i radzieckim. W meczu tym Związek Ra¬ 
dziecki reprezentowała maszyna cyfrowa M-20, na¬ 
tomiast Stany Zjednoczone — maszyna IBM 7090. 

W rzeczywistości mecz odbywał się nie między 
komputerami, a między grupami naukowców z obu 
krajów; był to po prostu bardzo ciekawy ekspery¬ 
ment naukowy mający dać odpowiedź na pytanie, 
który program szachowy jest lepszy. Program ra¬ 
dziecki opracowała grupa pracowników Instytutu 
Fizyki Teoretycznej i Eksperymentalnej w Moskwie, 
a program amerykański — grupa pracowników 
naukowych z Uniwersytetu Stanford; grupą tą 
kierował wybitny specjalista z zakresu programo- 
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wania maszyn cyfrowych, John McCarthy. Wynik 
meczu był niekorzystny dla amerykańskiej grupy 
naukowców: maszyna amerykańska przegrała 

w stosunku 1 : 3, pomimo iż była większa od maszyny 
radzieckiej. 

Obydwa programy szachowe były opracowane 
według koncepcji Shannona, oczywiście odpowiednio 
zmodyfikowanej, i cechowały się heurystycznym, 
a więc w dużym stopniu subiektywnym podejściem 
do problemu rozegrania gry w szachy. Gdyby oby¬ 
dwa wymienione programy szachowe były optymalne, 
mecz komputerów skończyłby się wynikiem 0 :0, 
tj. remisem. Dotychczas jednak brak optymalnych 
programów szachowych. Opracowanie takich pro¬ 
gramów łączy się z odejściem od metody heury¬ 
stycznej i zastąpieniem jej przez pewną metodę 
zdeterminowaną, nie zawierającą elementów prawdo¬ 
podobieństwa i subiektywizmu. Odejście od metody 
heurystycznej w układaniu programów szachowych 
nie jest jednak takie proste, gdyż łączy się z roz¬ 
wiązaniem wielu dodatkowych zagadnień, a w szcze¬ 
gólności z gruntowną analizą matematyczną gry 
w szachy. Analiza matematyczna gry w szachy 
jest zagadnieniem niezmiernie ciekawym i bardzo 
istotnym w poszukiwaniu metody opracowania opty¬ 
malnego programu szachowego, niestety stanowi 
do tej pory prawie całkowicie „białą plamę” w pro¬ 
blematyce szachowej. 

Z powyższych względów problem optymalnego 
rozgrywania gry w szachy przez automat, którego 
szczególną postacią jest maszyna odrowa, pozo¬ 
staje w dalszym ciągu otwarty i jest przedmiotem 
zainteresowania wielu naukowców. Ma on duże 
znaczenie poznawcze, gdyż rzutuje na możliwość 
wykorzystania automatów rozgrywających w ukła¬ 
dach cybernetycznych, służących do sterowania 
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szczególnie złożonymi procesami fizycznymi da¬ 
jącymi się opisać modelem matematycznym gry. 

Krótka charakterystyka złożoności omawianego 
problemu cybernetycznego oraz jedna z możliwych 
do przyjęcia koncepcji jego rozwiązania przed¬ 
stawiona zostanie poniżej. 


Gra w szachy w ujęciu algebry zbiorów 

W grze w szachy każdy z graczy dysponuje 
skończonym zbiorem możliwych do wykonania 
strategii chodowych. W skład każdego takiego zbioru 
wchodzą 6194 elementy, przedstawione w postaci 
symboli wyrażających odpowiedni ruch figur na 
szachownicy. Ruch figury jest strategią chodową 
i nie należy go mylić z ruchem w grze, gdyż ruch 
w grze jest zbiorem wyborów (por. rozdział 1). 
W grze w szachy zbiór możliwych do wykonania 
strategii chodowych każdego z graczy można po¬ 
dzielić na szesnaście podzbiorów, z których każdy 
przyporządkowany jest jednej figurze. Elementem 
takiego podzbioru jest ruch danej figury z jednego 
pola na inne, reprezentujący ściśle określoną strategię 
chodową gracza. Na przykład w podzbiorze przy¬ 
porządkowanym pionkowi stojącemu w pozycji 
wyjściowej na polu al elementem podzbioru jest 
dowolny ruch tego pionka, który może być wyko¬ 
nany w procesie prowadzenia gry. Ruch tego pionka 
z pola dl na pole di opisany jest symbolem dl—di 
i wyraża jedną ze strategii chodowych gracza B 
dysponującego figurami białymi. Zapis notacji 
pełnej możemy uprościć, przyporządkowując mu 
element z*. Określając w podobny sposób wszystkie 
możliwe ruchy białych figur na szachownicy i ko¬ 
dując każdy z tych ruchów symbolem z Jt gdzie j 



— liczba naturalna przyjmująca wartości od 1 do 
6194, zbiór możliwych strategii chodowych gracza B 
przedstawiać się będzie następująco 

Z r % 

— \ZZ2 9 Zj 9 ^ 6194 -/ 

Natomiast dla gracza A, dysponującego figurami 
czarnymi, zbiór możliwych jego strategii chodowych 
przedstawić można następująco 

^ ~ 0 h» •••> yi > •••> ^6194}■ 

Z liczby 6194 elementów zbioru Z lub zbioru Y, 
620 elementów przypada na ruchy pionków, 1792 — 
na wieże, 896 — na gońce, 672 — na skoczki, 1792 — 
na hetmana, 422 — na króla. 



g b c d e f g h 
Ryc. 32 


Dla ilustracji, na ryc. 32 przedstawiono sposób 
określenia liczby wszystkich możliwych ruchów 
pionka stojącego w pozycji wyjściowej na polu d2. 
Wykazane na rysunku linie przerywane są grani- 
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cami obszaru możliwego działania tego pionka, 
natomiast liczba możliwych jego ruchów wynosi 92. 
Oczywiste jest, że w procesie realizacji gry, w mo¬ 
mencie zdecydowania się na ruch pionkiem gracz 
dokonuje wyboru ruchu nie w zbiorze 92 elementów, 
lecz w pewnym podzbiorze ruchów dopuszczal¬ 
nych, określonych aktualnym położeniem pionka. 
Stąd też w odniesieniu do wszystkich figur, w każdej 
sytuacji powstałej na szachownicy gracz dokonuje 
wyboru kolejnego ruchu nie ze zbioru ruchów moż¬ 
liwych, lecz ze zbioru ruchów dopuszczalnych, przy¬ 
porządkowanego aktualnej sytuacji powstałej na 
szachownicy i zawierającego dopuszczalne do wy¬ 
konania w tej sytuacji strategie chodowe gracza. 
W grze w szachy można wyróżnić tyle zbiorów 
ruchów dopuszczalnych, ile jest możliwych sytuacji, 
które mogą wystąpić na szachownicy w procesie 
realizacji gry. Dowolny zbiór ruchów dopuszczal¬ 
nych jest zawsze częścią składową zbioru ruchów 
możliwych i zawiera nieznaczną ilość elementów 
tego zbioru. 


Szachy — gra z naturą 

Zgodnie z teorią gier, grę w szachy zalicza się 
do klasy gier wielochodowych z pełną informacją. 
Postacią graficzną łych gier jest dendryt gry. 

Gra w szachy ma również swój dendryt gry, jednak 
dendryt ten jest prawie astronomicznych rozmiarów 
i jego narysowanie jest niemożliwe. Można naryso¬ 
wać tylko niektóre fragmenty tego dendrytu, 
a w szczególności te, które dotyczą sytuacji związa¬ 
nych z obecnością znikomej liczby figur na sza¬ 
chownicy. Możliwa do wyrysowania jest również 
początkowa część dendrytu gry w szachy, której 


175 



fragment został przedstawiony na ryc. 33. Zgo 
z tym rysunkiem, w momencie rozpoczęcia 
a więc w pierwszym posunięciu, zbiór dopuszi 
nych do wykonania strategii chodowych każ< 



z graczy składa się tylko z dwudziestu elemeni 
Z wierzchołka początkowego dendrytu wych 
dwadzieścia krawędzi opisanych elementami oc 
do z 20 , które oznaczają odpowiednie strategie < 
dowe gracza B. Gdy gracz B wykona którąś z 
puszczalnych dla siebie strategii chodowych, 
znajdzie się w jednym z dwudziestu wierzchoł] 
typu Al pierwszego piętra dendrytu. Wierzchołek 
sygnalizuje, że ruch ma wykonać gracz A. Ponie 
w pierwszym posunięciu gracz A ma prawo wykc 
też tylko jedną strategię chodową z dwudzł 
dopuszczalnych, to po wykonaniu przez niego ru 
sytuacja powstała w grze określona będzie jedi 
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z 400 wierzchołków typu ĄJ, znajdujących s 
poziomie zamykającym pierwsze piętro den 
Liczba krawędzi wychodzących z dowolnego 2 
wierzchołków może być już większa od dwud; 
stąd też liczba wierzchołków Al w drugim f 
dendrytu jest większa od 8000. Z przedstawi 
fragmentu wynika, że wraz ze wzrostem liczb 
sunięć następuje zwiększenie rozmiarów den 
Pomimo iż dendrytu gry w szachy nie r 
narysować, to jednak znając strukturę tego der 
można na niej oprzeć dokładną analizę gry w ss 
Jak wiadomo, rozwiązanie dowolnej gry 
osobowej sprowadza się do znalezienia optyme 
strategii pełnych obu graczy oraz wartości w 
końcowego gry, który jest jednoznacznie okre 
przez te strategie. Jakiekolwiek odstępstwo d 
gracza od przyporządkowanej mu strategii optyr 
jest zawsze przyczyną niekorzystnego dla 
wyniku końcowego gry, przy spełnieniu war 
że jego przeciwnik nie odstępuje od swojej str 
optymalnej. Gra w szachy ma również swoje 
wiązanie, lecz znalezienie tego rozwiązania 
obecnie niemożliwe, nawet przy wykorzystani! 
bardziej nowoczesnych maszyn cyfrowych, 
czyną tego, jak mówiliśmy, jest olbrzymia 
możliwych strategii pełnych będących w dysp< 
każdego z graczy, jak również ograniczona szy 
wykonywania operacji przez maszynę cyf 
Z faktu, że gra w szachy jest tymczasem n: 
wiązalna, można wyciągnąć korzystny wniosę! 
tyczący analizy tej gry. Mianowicie, jeżeli grac 
zna swojej optymalnej strategii pełnej w grze \ 
chodowej, to wówczas wykonywane przez 
strategie chodowe są obarczone większym lub n 
szym błędem. W takiej sytuacji, realizując dov 
strategię chodową, dany gracz opiera się wyłą 
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na nabytym doświadczeniu i na regułach gry, ale 
w konsekwencji dokonywanego przez siebie wyboru 
nie jest pewny, czy przyjęta przez niego strategia 
chodowa zapewni mu wygraną. Z istnienia więc 
w grze w szachy pewnego czynnika losowego wynika, 
że jedną ze stron dogodnie jest potraktować jako 
naturę, która wybierając swoje strategie chbdowe spo¬ 
sobem losowym popełnia błędy wykorzystywane przez 
stronę przeciwną do maksymalizowania wygranej. 

Załóżmy teraz, że interesuje nas rozegranie partii 
gry w szachy z punktu widzenia gracza A dyspo¬ 
nującego figurami czarnymi. Z przyczyn podanych 
wyżej posiadanie informacji przez stronę A o swej 
optymalnej strategii pełnej w grze staje się zbędne, 
gdyż wykorzystując Wędy popełniane przez stronę B, 
strona A też z konieczności jest zmuszona do od¬ 
stępstwa od swojej optymalnej strategii pełnej w celu 
zmaksymalizowania swojej wygranej. Maksymali¬ 
zacja wygranej w grze w szachy sprowadza się do 
uzyskania wygranej przez gracza A przy mniejszej 
liczbie ruchów niż liczba ruchów wynikająca ze 
strategii optymalnej. Aby uzyskać możliwość maksy¬ 
malizowania swej wygranej kosztem błędów popeł¬ 
nianych przez stronę przeciwną, strona A zmuszona 
jest do opracowania odpowiedniego algorytmu po¬ 
stępowania. Opracowanie tego algorytmu sprowadza 
się do przeprowadzenia jednostronnej optymalizacji 
dendrytu gry w szachy za pomocą elektronicznej 
maszyny cyfrowej. 

Jednostronna optymalizacja dendrytu gry 

w szachy 

Celem jednostronnej optymalizacji dendrytu 
gry w szachy jest wyeliminowanie z dendrytu nie¬ 
korzystnych dla gracza A strategii chodowych, 
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co równoznaczne jest z wykreśleniem odpowiednich 
krawędzi dendrytu, a więc wraz z optymalizacją 
dendrytu następuje jego redukcja. Cechą charak¬ 
terystyczną jednostronnie zoptymalizowanego den¬ 
drytu gry jest to, że z każdego wierzchołka typu A" 
wychodzi tylko jedna krawędź. Stąd też przy reali¬ 
zacji gry według jednostronnie zoptymalizowanego 
dendrytu gry, gracz A w dowolnej sytuacji nie do¬ 
konuje wyboru strategii chodowej w zbiorze do¬ 
puszczalnych strategii chodowych odpowiadających 
tej sytuacji, gdyż dysponuje już tylko jedną, ściśle 
określoną optymalną strategią chodową. Zopty¬ 
malizowany dendryt gry odzwierciedla optymalne 
postępowanie gracza A w funkcji stosowanych przez 
gracza B strategii chodowych. Oczywiste jest, że 
przy grze w szachy pamiętanie przez gracza A wszyst¬ 
kich optymalnych strategii chodowych w funkcji 
wszystkich ruchów poprzednich, swoich i swego 
przeciwnika, jest niemożliwe. Gracza A można 
jednak zastąpić automatem, który potrafi zapamiętać 
strukturę jednostronnie zoptymalizowanego den¬ 
drytu gry i będzie prowadził grę na korzyść gracza A. 
Problem jednostronnej optymalizacji dendrytu gry 
w szachy jest bardzo złożony ze względu na olbrzymią 
liczbę możliwych wariantów rozegrania partii gry. 
Algorytm jednostronnej optymalizacji dendrytu gry 
w szachy zawiera 146 złożonych operacji, z których 
każda składa się z odpowiedniej liczby operacji 
elementarnych realizowanych przez maszynę cy¬ 
frową. 

Opracowany na podstawie tego algorytmu pro¬ 
gram powinien być wprowadzony do pamięci ma¬ 
szyny cyfrowej. Przedstawienie omawianego algo¬ 
rytmu, a tym samym programu, wykracza poza ra¬ 
my niniejszej książki, w związku z czym ograniczymy 
się tutaj tylko do pewnych uwag ogólnych. 
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Danymi do optymalizacji dendrytu gry w szachy 
przy pomocy maszyny cyfrowej są: zbiory Z i Y, 
pole robocze gry i elementy ruchów strony A i B. 
Polem roboczym gry jest model szachownicy za¬ 
pamiętany w 64 komórkach pamięci operacyjnej 
maszyny cyfrowej, z których każda odpowiada 
jednemu polu szachownicy, natomiast elementami 
ruchów są poszczególne figury. Zawartość zerowa 
którejś z wymienionych 64 komórek oznacza, że 
dane pole szachownicy nie jest zajęte, natomiast 
zawartość różna od zera wskazuje na aktualny ele¬ 
ment ruchu znajdujący się na tym polu. Na polu 
roboczym gry maszyna cyfrowa rozgrywa fikcyjne 
partie gry, które poddaje z kolei analizie celem 
wyeliminowania niekorzystnych strategii chodowych 
gracza A. Wyniki optymalizacji zapamiętane są 
w pamięci pomocniczej, wykonanej na taśmach 
magnetycznych. 

Optymalizacja dendrytu gry w szachy nie jest 
związana z koniecznością rozpatrywania całego 
dendrytu, lecz tylko z analizą pewnych jego frag¬ 
mentów. Niektóre części składowe dendrytu w ogóle 
nie podlegają analizie, a mianowicie te, które są 
zbudowane na krawędziach określonych w procesie 
analizy jako niekorzystne dla gracza A. 

Wynikiem jednostronnej optymalizacji dendrytu 
gry w szachy są elementy zbiorów Y i Z opisujące 
krawędzie jednostronnie zoptymalizowanego den¬ 
drytu gry. Ze względu na rozmiary dendrytu gry 
w szachy oraz ograniczoną pojemność pamięci 
operacyjnej maszyny cyfrowej optymalizacja tego 
dendrytu może być realizowana tylko częściami. 
Częścią składową kompletnego dendrytu gry w szachy 
nazywamy dendryt zbudowany na jednej krawędzi 
wychodzącej z danego wierzchołka Bg~ l . Na 
przykład dla pierwszego wierzchołka dendrytu B? 
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mamy dwadzieścia części składowych dendrytu ozna¬ 
czonych symbolami C®, C° 2 , ..., C° 20 . Dokonując 
podziału kompletnego dendrytu gry w szachy na 
części składowe na wysokości pierwszego piętra 
dendrytu, tj. opierając się na krawędziach wycho¬ 
dzących z wierzchołków B\, B\, B\, ..., i? 400 
uzyskalibyśmy części składowe C\, C\ t .... Cl, 
gdzie w > 400. Wyniki optymalizacji danej części 
składowej dendrytu są wyprowadzane każdorazowo 
do pamięci na taśmach magnetycznych. Pamięć 
operacyjna maszyny cyfrowej zostaje częściowo 
opróżniona i maszyna przystępuje do budowy na¬ 
stępnej z kolei części składowej dendrytu z jedno¬ 
czesnym przeprowadzeniem jej optymalizacji. Cho¬ 
ciaż w procesie optymalizacji niektóre fragmenty 
danej optymalizowanej części składowej C/ nie 
podlegają analizie, to jednak proces jednostronnej 
optymalizacji trwałby bardzo długo z powodu ogra¬ 
niczonej szybkości działania maszyny cyfrowej. 
Z uwagi na olbrzymią liczbę sytuacji, które należy 
przeanalizować w procesie optymalizacji dendrytu 
gry, szybkość liczenia współczesnych maszyn cyfro¬ 
wych jest jeszcze zbyt mała. 

W celu zmniejszenia czasu potrzebnego do opty¬ 
malizacji dendrytu gry w szachy, liczbę części skła¬ 
dowych dendrytu przeznaczonych do optymalizacji 
należy zredukować. Jest więc rzeczą słuszną po¬ 
dzielić je na pary, charakteryzujące się względem 
siebie pewnym podobieństwem. Taką parę części 
składowych dendrytu gry w szachy stanowią np. 
dendryt zbudowany na krawędzi wychodzącej z wierz¬ 
chołka B° u która jest opisana elementem z x oznacza¬ 
jącym ruch pionka gracza B z pozycji a2 na a3, oraz 
dendryt zbudowany na krawędzi wychodzącej z tego 
samego wierzchołka, lecz opisanej elementem z 15 
oznaczającym ruch pionka z pozycji hl na h3. 
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Oznaczamy odpowiednio oba wymienione den- 
diyty symbolami i C\ s . Znając zoptymalizowaną 
postać dendrytu C° zbudowanego na krawędzi z x 
wychodzącej z wierzchołka B\ można określić zopty¬ 
malizowaną postać dendrytu C° 15 drogą zmiany ele¬ 
mentów Zj i y t opisujących krawędzie dendrytu C®. 
W tym też celu należy określić odpdwiadające sobie 
elementy zbiorów Z i Y, które występują w opisie 
obu części C® i C° 15 . Proces ten polega na przepro¬ 
wadzeniu analizy przy pomocy maszyny cyfrowej, 
w której wyniku otrzymujemy ustalenie, że np. ele¬ 
ment z 32 występujący w opisie dendrytu C® odpo¬ 
wiada elementowi z 80 dendrytu C° 15 , itd. Analiza taka 
może być przeprowadzona przez maszynę cyfrową 
w czasie wielokroć krótszym od czasu jednostronnej 
optymalizacji dendrytu C° 15 . 

Redukując do minimum liczbę tych części składo¬ 
wych kompletnego dendrytu gry w szachy, które 
podlegają jednostronnej optymalizacji, całą operację 
związaną z optymalizacją można przeprowadzić 
w realnym z praktycznego punktu widzenia cza¬ 
sie. 

Jednostronna optymalizacja dendrytu gry w szachy 
przy pomocy maszyny cyfrowej jest niczym innym, 
jak przyspieszonym procesem uczenia się przez auto¬ 
mat gry w szachy. Każde podejście do zagadnienia 
rozwiązania automatycznego rozgrywania gry 
w szachy kończy się wnioskiem, że automat tego 
typu powinien być automatem uczącym się. Pojęcie 
automatów uczących się jest szeroko rozpatrywane 
w cybernetyce. Gdyby udało się zbudować automat 
uczący się grać w szachy, to proces uczenia się takiego 
automatu trwałby bardzo długo. Stąd też wydaje się 
celowe przyspieszyć ten proces przy pomocy elek¬ 
tronicznej maszyny cyfrowej, drogą jednostronnej 
optymalizacji dendrytu gry. 
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Gra w szachy w teorii automatów skończonych 

Z punktu widzenia matematyki, najważniej¬ 
szym zagadnieniem przy rozpatrywaniu gry w szachy 
jest niewątpliwie znalezienie wyrażenia analitycz¬ 
nego opisującego optymalny sposób prowadzenia 
gry przez danego gracza, np. przez gracza A. Takie 
wyrażenie można określić znając jednostronnie zopty¬ 
malizowany dendryt gry. 

W jednostronnie zoptymalizowanym dendrycie gry 
w szachy dany wierzchołek typu B£ określa 
jednoznacznie sytuację powstałą na szachownicy po 
posunięciu n. 

Jeżeli sytuację powstałą na szachownicy po po¬ 
sunięciu n, gdzie n = 1, 2, ..., m, oznaczymy w sensie 
ogólnym symbolem F(n), to zbiór możliwych sytuacji 
po posunięciu » będzie przedstawiał się następująco 

{F(n)} = {FI, F 2 , ..., Ff, ..., F t n n } 


Każdy element tego zbioru jest nazwą sytuacji 
i przyporządkowany jest jednemu wierzchołkowi B£ 
jednostronnie zoptymalizowanego dendrytu gry. Przy 
rozgrywaniu danej partii gry, sytuację powstałą po 
posunięciu n opisuje tylko jeden element zbioru {F(n)}. 
W podobny sposób zdefiniowane są również zbiory 
możliwych sytuacji dla wszystkich wartości wiel¬ 
kości ». Na przykład dla n— 1 przy spełnieniu wa¬ 
runku, że n > 1 , zbiór możliwych sytuacji przed¬ 
stawia się następująco 

{F(»—1)} = {Fr\ Fr 1 , .... F t ,TJ 2 } 

Zgodnie ze strukturą jednostronnie zoptymalizo¬ 
wanego dendrytu gry, w dowolnej sytuacji F(n- 1) = 
= F" -1 przyporządkowanej wierzchołkowi typu 
F/ -1 , wykonana przez gracza B w posunięciu n 
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strategia chodowa z(ń) = z 3 narzuca graczowi A 
tylko jedną dopuszczalną dla niego strategię cho¬ 
dową y(n) = y t . 

Gracz A nie ma innego wyboru i musi wykonać 
narzuconą sobie strategię chodową, gdyż grę pro¬ 
wadzi według jednostronnie zoptymalizowanego den- 
drytu gry. Stąd też wykonana przez gracza B w danej 
sytuacji F(n — 1) = F?~ l strategia chodowa z(n) = Zj 
jednocześnie określa nową sytuację F(n), która po¬ 
wstanie na szachownicy po posunięciu n. Wobec 
powyższego proces prowadzenia gry można opisać 
następującą parą funkcji 

m=f[F(n-l),z(ń)} (6.1) 

y(ń) = <p[F(n)] (6.2) 

Funkcje te interpretujemy następująco. Sytuacja 
F(n) powstała na szachownicy po posunięciu n jest 
funkcją sytuacji powstałej w posunięciu n— 1 oraz 
ruchu z(n) wykonanego przez gracza B w posunię¬ 
ciu n. Podobnie wybór przez gracza A odpowiedniej 
strategii chodowej w posunięciu n, oznaczony sym¬ 
bolem y(n), jest funkcją sytuacji, jaka powstanie po 
posunięciu n . 

Dokonując przekształcenia wyrażenia (6.2) otrzy¬ 
mamy 

y(n) = <p[F(«)] = | f[F(n- 1), z(«)]] (6.3) 

Z przedstawionych wyrażeń wynika, że przed 
dokonaniem ruchu w posunięciu n przez gracza A, 
na którego korzyść przeprowadzona została jedno¬ 
stronna optymalizacja dendrytu gry, gracz ten po¬ 
winien znać sytuację F{ń), jaka powstanie po posunię¬ 
ciu n. 

Sformułowanie to jest słuszne, gdyż w posunię¬ 
ciu n gracz B wykonując swój ruch narzuca graczowi A 
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sytuację F(ń), której gracz A nie może zmienić 
i w związku z tym wykonuje strategię chodową przy¬ 
porządkowaną tej sytuacji. 

Posługiwanie się wyrażeniami (6.1) i (6.2) przez 
gracza A w procesie realizacji gry w szachy w prak¬ 
tyce jest utrudnione, gdyż wymagałoby to od niego 
znajomości wszystkich ścieżek jednostronnie zopty¬ 
malizowanego dendrytu gry lub korzystania ze 
specjalnego zestawu tablic z danymi, które umożli¬ 
wiłyby korzystanie z wyrażeń (6.1) i (6.2). 

Ze względu na te trudności narzuca się koniecz¬ 
ność zastąpienia gracza A automatem, który roz¬ 
grywałby grę na jego korzyść i którego działanie 
zgodne byłoby z funkcją (6.1) i (6.2). Takiego ro¬ 
dzaju automat jest automatem skończonym — roz¬ 
grywającym. Każdy stan wewnętrzny automatu roz¬ 
grywającego grę w szachy odzwierciedlałby aktualnie 
powstałą sytuację w procesie prowadzenia gry, 
która jest reprezentowana jednym z wierzchołków 
B* jednostronnie zoptymalizowanego dendrytu gry. 
Zgodnie z postacią wyrażenia (6.1) i (6.2) automat 
rozgrywający jest układem z pętlą sprzężenia zwrot¬ 
nego, gdyż do właściwego jego funkcjonowania 
w posunięciu n na wejście automatu oprócz sygnału 
wejściowego z } powinna być doprowadzona infor¬ 
macja o stanie automatu w poprzednim posunięciu 
/i—1. Ponieważ stan wewnętrzny automatu po po¬ 
sunięciu n— 1 — oznaczony symbolem F{n—l) 
— powinien być pamiętany aż do momentu przejścia 
automatu w nowy stan F(n), interesujący nas auto¬ 
mat jest automatem z pamięcią. Schemat blokowy 
automatu przedstawiono poglądowo na ryc. 34. 
Struktura wewnętrzna tego typu automatu została 
omówiona w rozdziale piątym; przydatna jest 
ona do praktycznej realizacji takiego automatu, 
oczywiście przy znajomości jednostronnie zopty- 
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malizowanego dendrytu gry. Automat rozgrywający, 
przeznaczony do rozgrywania gry w szachy z rozum¬ 
nym przeciwnikiem B, działałby zgodnie z jedno¬ 
stronnie zoptymalizowanym dendrytem gry. Sygnał 


i 

t 


^Urządzenie 

[zewnętrzne 



informacja o stanie F(n-1) 


Ryc. 34 

wyjściowy wypracowany przez automat reprezen¬ 
towałby optymalną strategię chodową gracza A 
w danym posunięciu «, a tym samym sterowałby 
automatycznym przesunięciem jednej z czarnych 
figur na szachownicy, stanowiącej urządzenie ze¬ 
wnętrzne układu (ryc. 34). Realizując grę według 
jednostronnie zoptymalizowanego dendrytu gry, 
automat z zasady zawsze wygrywałby z rozumnym 
przeciwnikiem. Przegrana automatu jest całkowicie 
wykluczona, a prawdopodobieństwo uzyskania re¬ 
misu jest bardzo znikome. 

Przedstawiona wyżej charakterystyka interesują¬ 
cego nas problemu cybernetycznego wskazuje, że 
istnieje możliwość zbudowania automatu, który 
rozgrywałby grę w szachy w sposób optymalny z do¬ 
wolnym przeciwnikiem. Zbudowanie takiego auto¬ 
matu i praktyczne posługiwanie się nim świadczyłoby 
o tym, że automat zbudowany przez człowieka prze- 
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wyższa niewspółmiernie ludzkie zdolności rozwią¬ 
zywania pewnych złożonych problemów. Oczywiste 
jest, że automat ten nie jest modelem mózgu, gdyż 
wykonuje tylko pewną ściśle określoną czynność, 
nie wykonując olbrzymiej liczby pozostałych, stąd 
też nie można mówić o jego inteligencji. Budowa 
tego typu automatu stała się możliwa tylko dzięki 
istnieniu elektronicznych maszyn cyfrowych, które 
umożliwiają dokonywanie ogromnej ilości przeliczeń 
celem określenia optymalnego modelu matematycz¬ 
nego rzutującego na strukturę automatu. Chociaż 
praktyczna korzyść z automatu rozgrywającego grę 
w szachy jest znikoma, to jednak jego struktura 
i sposób działania rzutują na całą klasę automatów 
rozgrywających, które mogą być wykorzystane 
w układach cybernetycznych do celowego oddzia¬ 
ływania na określone zjawiska fizyczne. 



Samosterowalność obiektu w przestrzeni 
w ujęciu gry wielochodowej 


Obiekt w przestrzeni a cybernetyka 


Datujący się od kilku lat burzliwy rozwój 
astronautyki byłby niemożliwy bez rozwiązania sze¬ 
regu problemów z zakresu sterowania obiektami 
w przestrzeni. W rozwiązywaniu tych problemów 
niezmiernie ważną, a jednocześnie podstawową rolę 
odgrywa cybernetyka. Łączy się to ściśle z definicją 
cybernetyki jako nauki o sterowaniu w sensie ogól¬ 
nym i związanym z nim przetwarzaniu informacji 
występującej w procesie sterowania. 

Do niewątpliwych osiągnięć cybernetyki w tym 
zakresie należy zaliczyć sukcesy odniesione przez 
bezzałogowe statki kosmiczne w badaniu powierzchni 
Srebrnego Globu. Zrealizowane lądowanie automatu 
na powierzchni Księżyca i jego powrót na Ziemię, 
jak również penetracja powierzchni Księżyca przez 
automat, wskazują na olbrzymią przydatność dal¬ 
szego rozwoju tej nauki dla potrzeb współczesnej 
cywilizacji. 

Ponieważ z tych potrzeb wypływa m.in. koniecz¬ 
ność badania otaczającej nas przestrzeni — a ogólnie 
przestrzeni kosmicznej — uzasadnione stają się 
prace zmierzające do zapewnienia szeroko posu¬ 
niętej samodzielności bezzałogowych obiektów 
w przestrzeni w podejmowaniu samodzielnych de- 



cyzji. Łączy się to z budową automatów przeznaczo¬ 
nych do sterowania działaniem obiektów realizują¬ 
cych w przestrzeni określone z góry zadania. W ogól¬ 
nym przypadku bezzałogowy obiekt w przestrzeni 
może być zdalnie sterowany w układzie Ziemia—obiekt 
lub też może być samodzielnym obiektem cyberne¬ 
tycznym, działającym zgodnie z decyzjami wypra¬ 
cowanymi przez umieszczony w nim automat. Po¬ 
nieważ zdalne sterowanie obiektem w przestrzeni 
jest nie zawsze możliwe, problem rozwiązania samo- 
sterowalności obiektów nabiera coraz większego 
znaczenia i jest konsekwencją właściwego kierunku 
rozwojowego cybernetyki. 

Samosterujący bezzałogowy obiekt w przestrzeni, 
nazywany dalej samodzielnym obiektem cyberne¬ 
tycznym, jest niczym innym, jak robotem w prze¬ 
strzeni z narzuconym mu programem działania. 
Program ten może być mniej lub bardziej złożony, 
w zależności od treści zadania wykonywanego przez 
obiekt i od liczby możliwych sytuacji wpływających 
na realizację tego zadania. Program działania obiektu 
jest zawarty w strukturze automatu skończonego, 
który, ze względu na pełnioną przez siebie funkcję, 
jest jak gdyby mózgiem obiektu. 

Zasadę samosterowalności obiektu cybernetycz¬ 
nego w przestrzeni najłatwiej będzie wyjaśnić na 
przykładzie analizy możliwego działania tego obiektu 
w procesie pościgu i zbliżania się. Wnioski wynika¬ 
jące z takiej analizy, będącej możliwą do przyjęcia 
koncepcją rozwiązania problemu samosterowalności 
danego obiektu, można uogólnić na szereg innych 
procesów i wariantów działania obiektów w prze¬ 
strzeni. Stąd też dalsza część rozdziału poświęcona 
będzie szerszemu naświetleniu zagadnienia zapew¬ 
nienia samosterowalności dla obiektu realizującego 
proces pościgu w przestrzeni. 
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Pościg w przestrzeni w ujęciu cybernetycznym 

Załóżmy, że w przestrzeni — tak jak to po¬ 
kazano na ryc. 35 — znajdują się dwa obiekty A i B, 
rozmieszczone względem siebie w pewnej odległości 
i poruszające się z różnymi prędkościami. Obiekt A 
możemy potraktować jako taki bezzałogówy obiekt 
w przestrzeni, który jest samodzielnym obiektem 
cybernetycznym o działaniu zdeterminowanym 
i zgodnym z decyzjami wypracowanymi przez znaj¬ 
dujący się wewnątrz obiektu automat skończony. 
Natomiast obiekt B może być obiektem załogowym, 

samodzielnym obiektem 
cybernetycznym lub 
obiektem natury. 

Jeśli zadaniem obiek¬ 
tu A będzie zbliżenie 
się do obiektu B, a za¬ 
daniem dla B będzie 
uniknięcie spotkania 
z A, to wówczas po¬ 
wiemy, że w przestrzeni 
zachodzi proces pości¬ 
gu. Pościg ten realizuje 
obiekt A, zaś obiekt B 
jest obiektem ścigania. 
W przypadku, gdy oby¬ 
dwa obiekty A i B będą 
dążyć w przestrzeni do 
wzajemnego zbliżenia 
się, realizowany przez 
nich proces nazwiemy procesem zbliżania się. Proces 
zbliżania się potraktować można jako szczególny 
przypadek procesu pościgu zachodzący wtedy, gdy 
obiekt B wykonując zadanie ucieczki przed A po¬ 
pełnia niedopuszczalne błędy w swoim postępo- 
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waniu. Stąd też dalej zajmować się będziemy wy¬ 
łącznie procesem pościgu jako procesem bardziej 
ogólnym. 

Z punktu widzenia matematyki proces pościgu 
jest grą dwuosobową należącą do klasy gier na prze¬ 
trwanie. Stąd też rozpatrując proces pościgu w ujęciu 
teorii gier możemy wyodrębnić dwa możliwe sposoby 
opisu tego procesu. Mianowicie, proces pościgu 
można opisać postacią gry wielochodowej typu 
ciągłego, zwaną często grą różniczkową, lub też 
postacią gry wielochodowej typu dyskretnego, omó¬ 
wioną w poprzednich rozdziałach. Druga postać gry 
wielochodowej jest bardziej przydatna do opisu 
procesu pościgu, gdyż ułatwia nam syntezę, a tym 
samym budowę automatu skończonego, który 
umieszczony w obiekcie A sterowałby jego działa¬ 
niem w procesie pościgu. Jak wiadomo, automat 
skończony jest dyskretnym przetwornikiem infor¬ 
macji, tzn. jest takim urządzeniem, które działa 
w ściśle określonych momentach czasu. Jego dzia¬ 
łanie sprowadza się do tego, że sygnał pojawiający 
się na wejściu zmienia stan wewnętrzny automatu, 
a ten z kolei warunkuje pojawienie się na wyjściu 
automatu odpowiedniego sygnału wyjściowego. 
W rozpatrywanym przypadku sygnałem wejścio¬ 
wym automatu jest informacja o obiekcie B, na¬ 
tomiast sygnałem wyjściowym jest wypracowana 
przez automat decyzja do sterowania obiektem A. 

Automat skończony umieszczony w obiekcie A 
reprezentuje ten obiekt w dwuosobowej grze wielo¬ 
chodowej opisującej proces pościgu, dlatego też okreś¬ 
lać go będziemy mianem automatu rozgrywającego. 
Drugą stroną gry jest obiekt B. Automat, jako strona 
gry, dysponuje zbiorem strategii chodowych 

y ~ y2> •••» yt> •••> .Fw} 
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natomiast strona B gry dysponuje zbiorem strategii 
chodowych 

Z I __ _ 

= V^l> •••» •••> 

Dowolny element y t zbioru Y określa możliwy do 
przyjęcia i ustalony wcześniej kierunek ruchu obiek¬ 
tu A w przestrzeni. W interpretacji automatu roz¬ 
grywającego element y, jest sygnałem wyjściowym 
automatu, a więc jest pewną decyzją wypracowaną 
przez automat i dotyczącą działania obiektu A. 
Podobnie dowolny element Zj zbioru Z wyraża 
kierunek ruchu obiektu B, a w interpretacji auto¬ 
matu rozgrywającego jest jego sygnałem wejścio¬ 
wym. 

Proces pościgu jest procesem ciągłym, natomiast 
przyjęty typ gry wielochodowej dotyczy procesu, 
który zachodzi w dyskretnych chwilach t u t 2 , ..., t u ... 
Rozbieżności między rzeczywistym przebiegiem pro¬ 
cesu pościgu a przebiegiem wynikającym z opisu¬ 
jącego go modelu matematycznego będą tym mniej¬ 
sze, im mniejsze będą odstępy między kolejnymi 
dyskretnymi chwilami t u t 2 , ..., fj ... 

Przy sterowaniu obiektem A z Ziemi dyskretne 
chwile są momentami, w których jest dokonywana 
obserwacja obiektu B, ustalane jego położenie i dzia¬ 
łanie oraz, w zależności od wyników obserwacji, 
pobierana decyzja do sterowania obiektem A. De¬ 
cyzja taka przekazywana jest do obiektu A drogą 
radiową. Ponieważ zgodnie z przyjętym założeniem 
obiekt A jest samodzielnym obiektem cybernetycz¬ 
nym, rolę obserwatora spełnia zamontowane w nim 
urządzenie radarowe, które w dyskretnych chwilach 
przekazuje wyniki obserwacji w postaci odpowiednio 
uformowanych sygnałów na wejście automatu, a ten 
z kolei wypracowuje decyzje do sterowania obiek¬ 
tem A. 
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Zasadę dyskretyzacji procesu pościgu wyjaśnić 
można na podstawie analizy sytuacji przedstawionej 
na ryc. 35. Tak, jak to na tym rysunku pokazano J 
obiekt A wykonując lot po wybranej trajektorii 
znalazł się w dyskretnej chwili t 0 w punkcie H 0 
przestrzeni. Załóżmy, że w tej samej chwili t 
urządzenie radarowe obiektu A ustaliło, że w punk¬ 
cie Eq znajduje się obiekt B, będący dla A obiektem 
ścigania. W chwili obiekt A nie może jeszcze mZ 
stąpić do realizacji procesu pościgu, gdyż nie znany 
mu jest aktualny kierunek przemiesz czania s ię 
obiektu B, nie zmienia więc on kierunku swego lotu 
W następnej dyskretnej chwili t x obiekt B znajduje 
się w punkcie E u natomiast obiekt A w punkcie H,. 
Znając położenie obiektu B w dwóch następujących 
po sobie dyskretnych chwilach i 0 i t ± obiekt A 
ustala przy pomocy posiadanych urządzeń kierunek 
przemieszczania, się obiektu B. Ustalony w ten spo¬ 
sób kierunek przemieszczania się obiektu B w okre- 

! 16 I 1 Jest strate S»ł chodową ZjeZ obiek¬ 

tu B w dwuosobowej grze wielochodowej. Dla auto¬ 
matu rozgrywającego znajdującego się w obiekcie A 
rozpoznana strategia Zj jest sygnałem wejściowym 
automatu. Pod wpływem tego sygnału zmienia sie 
stan wewnętrzny automatu i ^pracowana\st 
prawie w tej samej chwili t„ optymalna strategia 
chodowa y t dotycząca kierunku lotu obiektu A. 
W wyniku realizacji strategii y t w następnej chwili u 
obiekt A znajdzie się w punkcie H 2 , 

Jednocześnie w tej samej chwili t 2 na wejściu 
automatu pojawia się kolejny sygnał z r e Z doty¬ 
czący strategii chodowej obiektu B wykonanej w cza¬ 
sie T 2 = t 2 — t 1 . Automat rozgrywający wypraco¬ 
wuje nową strategię chodową y c , zgodnie z którą 
jest przeprowadzona korekcja lotu obiektu A. 
Analogiczny przebieg zachodzi w następnych dys- 
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kretnych chwilach, przy czym wraz ze zmniejsze¬ 
niem się odległości między obiektami maleje również 
okres 

T t = fi-/,-! 

między kolejnymi dyskretnymi chwilami, Oczywiste 
jest, że pozytywny wynik pościgu dla obiektu A jest 
możliwy do osiągnięcia tylko wtedy, gdy prędkość 
obiektu A jest większa od prędkości obiektu B. 


Pościg — gra wielochodowa parametryczna 

Z punktu widzenia teorii gier najbardziej 
uzasadnione jest rozpatrzenie procesu pościgu wujęciu 
gry antagonistycznej. Stąd też, przy założeniu, że 
prędkości obiektów spełniają nierówność V A > V B , 
strona A będzie dążyła do zminimalizowania czasu 
przechwytu, natomiast strona B do zmaksymalizo¬ 
wania tego czasu. Obiekt B zostaje przechwycony, 
gdy w wyniku realizacji procesu pościgu odległość / 
między obiektami będzie spełniać warunek l < s, 

gdzie s — wielkość zadana. 

W świetle osiągnięć współczesnej techniki rada¬ 
rowej gra opisująca proces pościgu może być po¬ 
traktowana jako gra z pełną informacją. W grze 
wielochodowej z pełną informacją każdy z graczy 
zna charakter i konsekwencje swoich strategii cho¬ 
dowych i strategii chodowych wykonywanych przez 
przeciwnika zarówno w danej chwili t, jak również 
we wszystkich chwilach poprzednich. 

W interesującej nas grze konsekwencją strategii 
chodowych stosowanych przez obie strony gry są 
zmiany położeń obiektów A i B w przestrzeni. Aby 
mieć pełną informację o przebiegu gry, automat 
rozgrywający powinien otrzymywać od urządzenia 
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radarowego informację nie tylko o strategiiJ'cho- 
dowej obiektu B, lecz również o jego położeniu 
i prędkości. Stąd też w dyskretnych chwilach na 
wejściu automatu powinna pojawiać się trzyele 
mentowa informacja określona wektorem 
b = IX/, Pb g r ], gdzie: 

Zj — kierunek ruchu obiektu B, 

Pi — wzajemne położenie obiektów względem 
• ^ * 
siebie, 

g r — stosunek prędkości VJ V B . 

Pierwsza współrzędna wektora b jest strategią 
chodową strony B gry, natomiast pozostałe współ¬ 
rzędne pi i g r są parametrami gry wielochodowej 
opisującej proces pościgu. Jak wiadomo, postacią 
graficzną gry wielochodowej jest dendryt gry. Dla 
ilustracji przykład fragmentu dendrytu gry pościgu, 
przy zadanej wielkości parametru g r = V A jV B 
i określonego położenia początkowego obiektów p u 
przedstawiono na ryc. 36. 

Każdy z wierzchołków dendrytu odzwierciedla 
sytuację powstałą w wyniku realizacji pościgu w danej 
dyskretnej chwili t i opisany jest symbolem obiektu, 
który w tej sytuacji dokonuje wyboru swojej strategii 
chodowej. Krawędzie dendrytu opisane są elemen¬ 
tami y t i Zj zbiorów fi Z, a więc przedstawiają 
strategie chodowe obiektów. W każdym piętrze 
dendrytu wyróżnia się dwa poziomy, poziom wierz¬ 
chołków A r n i poziom wierzchołków B". Wszystkie 
wierzchołki znajdujące się na danym poziomie do¬ 
tyczą tej samej dyskretnej chwili t. Różnica w cza¬ 
sach opisujących dwa incydentne ze sobą wierz¬ 
chołki (tj. połączone krawędzią) jest okresem, w ciągu 
którego wykonywana jest strategia chodowa przy¬ 
porządkowana krawędzi łączącej te wierzchołki 
(na ryc. 36 i 37 okres ten dotyczy strategii gracza A). 


13* 
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Korzeniem dendrytu jest wierzchołek B° u który 
określa sytuację początkową, jaka zaistniała w dy¬ 
skretnej chwili t 0 . Sytuacja ta jest opisana parą 
parametrów p h g r . Zgodnie z dendrytem przed¬ 
stawionym na ryc. 36, w sytuacji określonej wierz¬ 
chołkiem 3°i obiekt B, jako strona gry, wybiera 
jedną z możliwych dla siebie strategu ‘chodowych 
wchodzących w skład zbioru Z. W zależności od 
wybranej przez obiekt B strategii chodowej gra 
znajdzie się w jednym z wierzchołków A\, A\, 
..., Ay pierwszego piętra dendrytu. Załóżmy, że 
tym wierzchołkiem jest wierzchołek A\, tzn., że 
w czasie T t — ti — t 0 obiekt B wykonał strategię 
chodową z t . W chwili t u w sytuacji określonej 



Ryc. 36 
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Ryc. 37 


wierzchołkiem A\, zgodnie z regułami gry obiekt 
powinien przystąpić do wyboru i reaSacU jedr 
ze swoich strategii chodowych przynależnych c 
zbioru Y. Strategie te opisują krawędzie wych 
zące z wierzchołka A\. Wybrana przez obiekt 
strategia chodowa powinna być strategią optymaln 

zbliJć 7e m t\r jej .f st ? sowania obiekt ^ powinie 
zbhzyc się jak najbardziej do obiektu B. Błędu 


% 
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wybrana strategia chodowa może nigdy nie dopro¬ 
wadzić do uchwycenia obiektu B. 

Ponieważ proces pościgu jest procesem ciągłym 
i szybko zmieniającym się w czasie, przeprowadze¬ 
nie przez obiekt A wyboru optymalnej strategii 
chodowej w trakcie jego lotu jest niemożliwe. Stąd 
też dendryt gry z ryc. 36 nie odzwierciedla właściwego 
działania obiektu A, gdyż każdej sytuacji określonej 
w dendrycie wierzchołkiem typu A" musi być przy¬ 
porządkowana tylko jedna strategia chodowa, a nie 
zbiór strategii. Należy więc przeprowadzić jedno¬ 
stronną optymalizację dendrytu gry, polegającą na 
wyeliminowaniu z dendrytu wszystkich niekorzy¬ 
stnych dla obiektu A jego strategii chodowych. 
Optymalizację taką przeprowadza się przy pomocy 
komputera, a jej wynikiem jest jednostronnie zopty¬ 
malizowany dendryt gry, którego fragment przed¬ 
stawiono na ryc. 37. 

Przedstawione na rycinach 36 i 37 dendryty do¬ 
tyczą tylko jednego wybranego położenia obiektów 
w przestrzeni. Jak wiadomo, liczba możliwych po¬ 
łożeń dwóch punktów w przestrzeni jest nieskoń¬ 
czenie duża. Każde położenie dwóch punktów 
w przestrzeni może być traktowane jako położenie 
wyjściowe obiektów w procesie pościgu, a więc 
każdemu z tych położeń należy przyporządkować 
jednostronnie zoptymalizowany dendryt gry opisu¬ 
jący optymalne działanie obiektu A. Stąd też kom¬ 
pletny jednostronnie zoptymalizowany dendryt gry 
opisującej proces pościgu będzie kompozycją nie¬ 
przeliczalnej ilości dendrytów składowych, z których 
każdy opisany będzie inną parą parametrów p t , g r . 
Gra wielochodowa opisująca proces pościgu w prze¬ 
strzeni jest więc grą parametryczną, gdyż w zależ¬ 
ności od wartości parametrów p u g r reprezentowana 
jest ona przez inny dendryt składowy. 
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Kwantowanie przestrzeni 

Model matematyczny, opisujący działanie 
obiektu A wykonującego pościg w przestrzeni, 
powinien umożliwić zarówno interpolację rzeczy¬ 
wistego przebiegu procesu pościgu przez automat 
rozgrywający sterujący tym obiektem, jak również 
samą realizację automatu. Modelem tym jest jedno¬ 
stronnie zoptymalizowany dendryt gry składający się 
z nieskończonej ilości dendrytów składowych. 
Struktura jednostronnie zoptymalizowanego den- 
drytu gry powinna być zapamiętana w strukturze 
automatu rozgrywającego. Ponieważ automat roz¬ 
grywający realizujący grę wielochodową jest auto¬ 
matem skończonym, tj. posiadającym skończoną 
liczbę. stanów, realizacja omawianego typu auto¬ 
matu jest niemożliwa bez uprzedniego sprowadzenia 
dendrytu gry do postaci skończonej. Postać skoń¬ 
czoną dendrytu gry można osiągnąć przez wpro¬ 
wadzenie założenia, że proces pościgu odbywa się 
w pewnej ograniczonej przestrzeni metrycznej. 

Przestrzeń metryczna jest pojęciem zapożyczonym 
z topologii. Topologia jest działem współczesnej 
matematyki, zajmującym się badaniem takich cech 
tworów geometrycznych, które nie ulegają zmianie, 
gdy twory te poddajemy ściśle określonym prze¬ 
kształceniom (tzw. przekształceniom różnowartościo- 
wym i obustronnie ciągłym). Wymienione wyżej 
cechy tworów geometrycznych nazywamy niezmien¬ 
nikami topologicznymi. Na przykład cecha kwa¬ 
dratu polegająca na tym, że jego obwód rozcina 
płaszczyznę na dwa obszary, jest niezmiennikiem 
topologicznym; jeśli kwadrat przekształcimy w koło, 
w elipsę, w trójkąt lub też w prostokąt, cecha ta 
zostanie zachowana, gdyż obwód każdej z otrzy¬ 
manych figur geometrycznych, będących wynikiem 
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przekształcenia kwadratu, w dalszym ciągu dzieli 
płaszczyznę na dwa obszary. Przekształcenie tego 
typu jest różnowartościowe, gdyż dowolnie wyróż¬ 
niony punkt na obwodzie kwadratu odpowiada 
tylko jednemu punktowi okręgu koła i odwrotnie, 
a ponadto jest ono obustronnie ciągłe, co chyba 
w tym przypadku jest oczywiste. Ponieważ wymie¬ 
nione przez nas figury geometryczne można potrak¬ 
tować jako zbiory punktów, stąd też topologię 
możemy określić jako gałąź matematyki, która 
bada cechy zbiorów nie zmieniające się w wyniku 
pewnego typu przekształceń tych zbiorów na inne 
zbiory. Gdybyśmy np. założyli, że kwadrat zbudo¬ 
wany jest ze skończonej liczby punktów tworzących 
zbiór: R = {r x , r 2 , ..., r h ..., r fc }, to w wyniku prze¬ 
kształcenia kwadratu w koło uzyskalibyśmy zbiór 
S= {$!, s 2 , s u ..., s k } zawierający taką sarną 
liczbę elementów, z których każdy jest w dalszym 
ciągu punktem płaszczyzny, przy czym pola zbudo¬ 
wane z punktów e S i e R są sobie równe. 

Zbiory, których określone cechy są obiektem 
badań w topologii, noszą nazwę przestrzeni topo¬ 
logicznych. Podstawowym typem przestrzeni topo¬ 
logicznej jest przestrzeń metryczna. 

Dany zbiór H nazywamy przestrzenią metryczną 
wtedy, jeżeli każdej parze jego elementów, czyli 
każdej parze punktów h r , hj należących do zbioru H, 
przyporządkowana jest liczba rzeczywista ( h r —h } ) >0, 
zwana odległością punktu h r od punktu hj, która 
spełnia następujące warunki: 

1) (h r — hj) = 0 wtedy i tylko wtedy, gdy h r = hy, 

2 ) (hr-hj) = (hj-hr); 

3) (h r —hj)-\-(hj — h s ) ^ (h T — h s ). 

Zbiór H możemy podzielić na podzbiory. Każdy 
podzbiór przestrzeni metrycznej sam stanowi prze- 
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strzai metryczną, oczywiście przy nie zmienionej 
delmicji odległości. Maksymalną odległość (h r -h,) 
punktów hf i hj przestrzeni metrycznej H nazywamy 
średnicą przestrzeni H. Przestrzenie metryczne o śred¬ 
nicy skończonej noszą nazwę przestrzeni metry czn ych 
ograniczonych. Jeżeli przestrzeń metryczna H ma 
postać geometryczną sześcianu, a więc jest prze¬ 
strzenią^ ograniczoną, to taką przestrzeń metryczną 
nazywać będziemy sześcianem metrycznym. 

Sześcian metryczny jest bardzo cenną abstrakcją 
matematyczną przy rozpatrywaniu procesu pościgu 
w przestrzeni rzeczywistej. Zgodnie z podanym już 
wyżej założeniem będziemy przyjmować dalej, że 
rozpatrywany przez nas proces pościgu odbywa się 
w sześcianie metrycznym o odpowiednio ustalonych 
rozmiarach, uwarunkowanych odległością miedzy 
obiektami A i B. 

Sześcian metryczny obejmując obiekty A i B 
przemieszcza się w przestrzeni rzeczywistej z prędko- 
Va> tj. z prędkością równą prędkości obiektu A. 

Poprzez analogię do topologii, wprowadzony do 
rozważań sześcian metryczny będziemy traktować 
jako zbiór 

^ h 2 , ..., hj, ..., h r , ...^ 

w którym każdej parze elementów hj, h„ przyna¬ 
leżnych do tego zbioru, przyporządkowana jest 
liczba rzeczywista ( h r — h } ) nazywana odległością 
punktu h r od punktu h } . Każda para punktów sze¬ 
ścianu metrycznego określa możliwe położenie 
obiektów A i B w procesie realizacji pościgu. 

Ze względu na dyskretyzację modelu matematycz¬ 
nego opisującego proces pościgu zachodzi koniecz¬ 
ność ustalenia w zbiorze H, obejmującym wszystkie 
punkty sześcianu metrycznego, pewnych punktów 
jako punktów wyróżnionych. Punkty wyróżnione 
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sześcianu metrycznego tworzą zbiór 



Zbiór H' punktów wyróżnionych hi e H' jest 
zbiorem skończonym, a jednocześnie jest podzbiorem 
zbioru H, który z teoretycznego punktu widzenia 
jest zbiorem nieskończonym. Każdemu punktowi h[ 
wyróżnionemu w sześcianie metrycznym przypo¬ 
rządkowane są te punkty nie wyróżnione, które 
znajdują się w bezpośrednim sąsiedztwie danego 
punktu wyróżnionego. Z tego też wynika, że każdemu 
punktowi wyróżnionemu h\ przyporządkowana jest 
jak gdyby pewna mikroprzestrzeń metryczna, której 
środkiem jest dany punkt wyróżniony h\. 

W niniejszym ujęciu mikroprzestrzeń metryczna 
jest pewną elementarną częścią składową sześcianu 
metrycznego, charakteryzującą się tym, że ma po¬ 
stać geometryczną sześcianu i jeden tylko punkt 
wyróżniony znajdujący się w jej środku. Zgodnie 
z topologią zdefiniowana wyżej mikroprzestrzeń 
rozpatrywana oddzielnie jest również przestrzenią 
metryczną ograniczoną swymi rozmiarami. W danym 
sześcianie metrycznym wszystkie mikroprzestrzenie 
mają jednakowe, ściśle określone rozmiary. Umo¬ 
wnie przyjmuje się, że sześcian metryczny ma tyle 
mikroprzestrzeni, ile punktów wyróżnionych w swo¬ 
jej strukturze. 

Wyróżnione punkty przestrzeni metrycznej są 
pomocne w procesie identyfikacji przez automat 
rozgrywający położenia obiektu B w sześcianie 
metrycznym. Bez względu na to czy obiekt B w danej 
dyskretnej chwili t znajduje się w wyróżnionym 
punkcie przestrzeni, czy też w dowolnym innym 
punkcie, informacja o położeniu obiektu B dotyczy 
tylko punktu wyróżnionego. Jeżeli np. w danej 
chwili t obiekt B znajduje się w pewnym punkcie h r 
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przestrzeni metrycznej, który nie jest punktem wy¬ 
różnionym, na wejście automatu przychodzi infor¬ 
macja, że obiekt B znajduje się w takim punkcie 
wyróżnionym h' it w którego sąsiedztwie znajduje się 
punkt h r . 

Automat rozgrywający popełnia więc pewien błąd 
w identyfikacji rzeczywistego położenia obiektu B. 
Kres górny tego błędu zależy od rozmiarów mikro- 
przestrzeni przyporządkowanej punktowi wyróżnio¬ 
nemu, a tym samym od stopnia zagęszczenia punk¬ 
tów wyróżnionych w sześcianie metrycznym. Przy 
dużej odległości obiektów od siebie błąd ten ma mały 
wpływ na optymalność strategii chodowych wypraco¬ 
wywanych przez automat sterujący obiektem A. 
Natomiast przy małej odległości obiektów od siebie 
błąd ten rzutuje bardzo ujemnie na optymalne dzia¬ 
łanie obiektu A. Stąd też narzuca się konieczność 
przeprowadzenia zagęszczenia punktów wyróżnio¬ 
nych w sześcianie metrycznym w miarę zbliżania się 
obiektów do siebie. Zagęszczanie to uzyskuje się 
w wyniku odpowiedniego kwantowania przestrzeni 
metrycznej. 

Kwantowanie kojarzy się nam zwykle z pojęciem 
kwantu, a tym samym z fizyką. Samo słowo kwant 
pochodzi od łacińskiego słowa ąuantum — ile. 
Z fizyki wiadomo, że promieniowanie nie jest emito¬ 
wane w sposób ciągły, lecz określonymi porcjami 
energii. Te porcje lub pakiety energii promienistej 
przyjęto nazywać kwantami. 

Przez analogię do kwantu energii promienistej 
możemy wprowadzać umownie pojęcie kwantu prze¬ 
strzeni. Takim umownym kwantem przestrzeni może 
być sześcian metryczny o określonych rozmiarach. 
W procesie zbliżania się obiektów do siebie od¬ 
ległość między obiektami będzie się zmniejszać, aż 
wreszcie będzie tak względnie mała, że określenie 
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wzajemnego położenia obiektów w strukturze danego 
sześcianu będzie niemożliwe, gdyż brak będzie 
punktów wyróżnionych, którym można przyporząd¬ 
kować położenie obiektów. Zachodzi więc koniecz¬ 
ność zbudowania na tej względnie małej odległości 
między obiektami nowego sześcianu metrycznego 
o takiej samej strukturze jak poprzedni, lecz o znacz¬ 
nie mniejszych rozmiarach. W strukturze nowego 
sześcianu liczba punktów wyróżnionych znajdują¬ 
cych się między obiektami będzie już tak dostatecz¬ 
nie duża, że umożliwi określanie wzajemnego poło¬ 
żenia obiektów A i B zarówno w danej dyskretnej 
chwili, jak w chwilach późniejszych. 

Ten nowy sześcian metryczny reprezentuje mniejszą 
porcję przestrzeni, inaczej mówiąc — kwant prze¬ 
strzeni o mniejszej wartości. Po pewnym czasie 
obiekty A i B w strukturze nowego sześcianu metrycz¬ 
nego znowu będą znajdować się w tak małej od¬ 
ległości od siebie, że nie istnieje możliwość określenia 
ich wzajemnego położenia. Wystąpi więc potrzeba 
budowy nowego sześcianu metrycznego obejmującego 
znacznie mniejszą porcję przestrzeni. 

W naszych rozważaniach przestrzeń metryczna 
jest pewną fikcyjną przestrzenią, która przemieszcza 
się w przestrzeni rzeczywistej z prędkością obiektu A. 
Co pewien czas ta przemieszczająca się przestrzeń 
skokowo zmniejsza swoje rozmiary nie zmieniając 
swojej struktury, która charakteryzuje się zawsze 
taką samą liczbą punktów wyróżnionych i takim 
samym ich rozmieszczeniem w sześcianie metrycz¬ 
nym. W powyższym procesie występuje jak gdyby 
pewne zjawisko kurczenia (zacieśniania) się prze¬ 
strzeni, otrzymywane drogą pobierania coraz to 
mniejszych porcji przestrzeni. To porcjowanie prze¬ 
strzeni przyjęto umownie nazywać kwantowaniem 
przestrzeni. 
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Kryterium tego kwantowania polega na przy¬ 
jęciu ciągu sześcianów metrycznych o odpowiednio 
zmniejszających się rozmiarach. Ciąg ten ma postać 

Qo, Qz> Qki Qk + 1j •••> Q(a 

przy czym Q k > Q k +i oraz Q k+1 c Q k - 

Sześciany metryczne mają przyporządkowane 
sobie trzy parametry: liczbę k, zwaną stopniem 
kwantowania; liczbę 4, określającą długość krawędzi 
sześcianu metrycznego o stopniu kwantowania k; 
liczbę e k , określającą warunek zakończenia gry 
w przestrzeni metrycznej o stopniu kwantowania k. 
Sześcian metryczny Q 0 , tj. o stopniu kwantowania 
k = 0, zawiera sześciany metryczne o wszystkich 
pozostałych stopniach kwantowania od k — l do 
k = (O. 

W miarę zbliżania się obiektów do siebie nastę¬ 
puje podział sześcianu Q 0 na coraz mniejsze sześciany 



aż do sześcianu Q w włącznie. Dla ilustracji, na ryc. 38 
przedstawiono podział sześcianu Q 0 na sześciany 
o stopniach kwantowania k = 1, 2, 3 przy założeniu, 
że obiekty A i B przemieszczają się tylko w jednej 



płaszczyźnie przekroju poprzecznego sześcianu Q 0 
i nie dokonują zmiany kierunków ruchu. Ponieważ 
sześcian metryczny przęmieszcza się z prędkością V A 
i zgodnie z kierunkiem ruchu obiektu A, można 
przyjąć, że położenie obiektu A ty strukturze sześ- 
ścianu nie ulega zmianie. Przy takim założeniu, 
obiekt B w obszarze sześcianu metrycznego będzie 
się jak gdyby zbliżał do obiektu A z prędkością 
Fi = V A -V B . Dlatego też sekwencja kolejnych 
położeń obiektu B w obrębie sześcianu metrycznego 
jest odwrotna, niż by to wynikało z rzeczywistego 
kierunku ruchu tego obiektu. Na ryc. 38 kolejne 
położenia obiektu B, przy których następuje zmiana 
stopnia kwantowania, oznaczono symbolami I, II, 
III, IV. 

Każdy sześcian metryczny, bez względu na przy¬ 
porządkowany sobie stopień kwantowania Ar, składa 
się z odpowiedniej liczby sześcianów podstawowych, 
a te z kolei z sześcianów elementarnych. Strukturę 
sześcianu metrycznego przedstawiono poglądowo na 
ryc. 39. 

Długość krawędzi sześcianu podstawowego, bę¬ 
dącego częścią składową danego sześcianu Q k , 
równa się zawsze liczbie e k . Jeżeli w trakcie pościgu 
w przestrzeni metrycznej o stopniu kwantowania k 
odległość między obiektami osiągnie wartość / «= e k , 
następuje przejście procesu pościgu z sześcianu 
metrycznego Q k do sześcianu metrycznego o wyż¬ 
szym stopniu kwantowania, tj. do Q k+i . W wyniku 
tego przejścia ten sześcian podstawowy, w którym 
znajdują się aktualnie obiekty A i B, staje się sze¬ 
ścianem metrycznym i podlega podziałowi na przy¬ 
porządkowane mu sześciany podstawowe i ele¬ 
mentarne. Wierzchołki sześcianów elementarnych są 
punktami wyróżnionymi w przestrzeni objętej sze¬ 
ścianem metrycznym danego stopnia kwantowania k. 
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Liczba punktów wyróżnionych w strukturze sześcianu 
metrycznego jest stała i nie zależy od jego rozmiarów. 
Wraz ze skokowym zmniejszaniem się rozmiarów 
sześcianu metrycznego, podyktowanym zmianą 
stopnia kwantowania, następuje zagęszczenie punk¬ 
tów wyróżnionych, a tym samym maleje błąd 
w identyfikacji rzeczywistego położenia obiektu B. 

Dendryt gry opisującej proces pościgu składa się 
z dendrytów składowych, z których każdy — przy 
założeniu, że g r = V A IV B = const — dotyczy okreś¬ 
lonego położenia obiektów A i B w sześcianie me¬ 
trycznym. W sześcianie metrycznym położenie 
obiektów określa się według punktów wyróżnionych. 
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Ponieważ liczba punktów wyróżnionych w sze¬ 
ścianie metrycznym jest wielkością skończoną, 
liczba dendrytów jest również skończona. Stąd też 
dendryt gry opisującej proces pościgu możemy 
rozpatrywać jako zbiór skończony o postaci 

D = {di, d 2 , ..., dj, ..., d v y 

którego \elementami są dendryty 3? składowe dj dla 
j = 1, 2* v. Każdy z dendrytów składowych dj 
jest jednostronnie zoptymalizowany na korzyść 
obiektu A jako strony gry, a tym samym określa 
zdeterminowane działanie automatu rozgrywa¬ 
jącego w sytuacji opisanej parą parametrów p t , g r . 
Struktura pojedynczego dendrytu dj e D nie zależy 
od stopnia kwantowania przestrzeni i dotyczy tej 
samej sytuacji w dowolnym sześcianie metrycznym 
z przyjętego ciągu sześcianów Q 0 , Q u Q 2 , ... Q a - 

W' wyniku przyjętej metody kwantowania prze¬ 
strzeni, proces pościgu można rozpatrywać jako grę 
złożoną z ciągu następujących po sobie i rozgrywa¬ 
nych między obiektami A i B partii gry. Każdy 
z dendrytów składowych djsD reprezentuje inną 
partię gry. 

Po każdorazowej zmianie stopnia kwantowania 
przestrzeni rozpoczyna się nowa partia gry, repre¬ 
zentowana tym samym lub innym dendrytem skła¬ 
dowym d } , w zależności od aktualnej sytuacji opi¬ 
sanej parą parametrów p h g r . Fakt ciągłego powta¬ 
rzania tej samej gry w procesie pościgu ułatwia 
i umożliwia budowę automatu rozgrywającego 
— sterującego obiektem A. 

Aproksymacja][trajektorii lotu obiektu ściganego 

W grze wielochodowej, opisującej proces 
pościgu w przestrzeni, strategie chodowe strony B 
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gry określa się jako ruchy obiektu ściganego wzdłuż 
linii prostych. Tymi liniami są pewne ustalone pro¬ 
mienie r bk kuli wpisanej w sześcian zbudowany 
z czterech sześcianów podstawowych. Sposób okreś¬ 
lania strategii chodowych obiektu B dla jednej 
z możliwych płaszczyzn przekroju sześcianu pod¬ 
stawowego pokazano na ryc. 40. 



< 5*0 


<5 = 7 


< 5*2 


< 5*2 


<5 = 4 


*0 


Ryc. 40 


^Pojedyncza strategia chodowa obiektu B w danej 
przestrzeni kwantowania k realizowana jest w czasie 
T k = f(V B ), przy czym 

— 4,i —4,f-i 

gdzie 4 (t , 4, ł _ 1 — to dyskretne chwile działania 
automatu sterującego obiektem A. W czasie T k , 
zgodnie z założeniem wynikającym z przyjętego 
modelu, obiekt B powinien przebyć drogę równą 
długości promienia r bk . Długość promienia r bk 
w obszarze sześcianu metrycznego danego stopnia 
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kwantowania k jest stała. Dzięki temu, że r bk = const 
dla k = const, strategie chodowe obiektu B różnią 
się między sobą nie długością drogi przebytej w cza¬ 
sie T k , lecz tylko przyporządkowanymi sobie kie¬ 
runkami przemieszczania się obiektu B. Wiadomo 
jednak, że w trakcie pościgu prędkość obiektu B może 
się zmienić. Stąd też, aby uzyskać* stałą długość 
drogi przebytej przez obiekt B w czasie T k , każdemu 
sześcianowi metrycznemu przyporządkowana jest 
stała wartość parametru g r = VJV B . Konsekwencją 
takich ograniczeń jest to, że ze wzrostem prędkości 
obiektu B powinna wzrosnąć również prędkość 
obiektu A, gdyż stosunek g, — V A jV B w obrębie 
pojedynczego sześcianu metrycznego powinien być 
stały. Ponadto, gdy V B rośnie, czas T k powinien 
maleć tak, aby droga przebyta przez obiekt B w cza¬ 
sie T k była w dalszym ciągu równa długości pro¬ 
mienia r bk . Nasuwa się więc wniosek, że przy zmianie 
prędkości V B , dla k = const, automat rozgrywający 
powinien ustalać sobie nowe dyskretne chwile i wy¬ 
pracowywać sygnały zmiany prędkości obiektu A. 
Po przejściu procesu pościgu z sześcianu metrycz¬ 
nego o stopniu kwantowania k do sześcianu o stop¬ 
niu kwantowania k + 1, droga przebyta przez obiekt 
B w czasie T k+1 — staje się pro¬ 

porcjonalnie mniejsza, a tym samym spełniana jest 
nierówność 


1“b,k ^ f 6,k+ 1 

Według scharakteryzowanych wyżej ograniczeń 
dotyczących ruchów obiektu B, a wynikających 
z przyjętych reguł gry opisującej proces pościgu, 
obiekt B porusza się tylko wzdłuż umownych pro¬ 
mieni kuli wpisanej w sześcian zbudowany z czte¬ 
rech sześcianów podstawowych danego sześcianu 
metrycznego i może dokonywać zmiany kierunku 
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ruchu tylko w ściśle określonych punktach sześcianu 
metrycznego. 

Jedna z możliwych trajektorii lotu obiektu B, 
wynikających z reguł gry i rozpoznawanych przez 
automat rozgrywający, jest przedstawiona na ryc. 41. 
W rzeczywistości ruchy obiektu B nie są ograniczone 
regułami gry, nie zawsze są one prostoliniowe, a tym 



samym zmiana kierunku ruchu obiektu B może 
nastąpić w dowolnym punkcie przestrzeni. Stąd też 
automat rozgrywający, sterujący obiektem A, będzie 
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popełniać błąd w procesie identyfikacji ruchów 
obiektu B jako ruchów po promieniach r bk , tzn. 
po liniach prostych. Błąd ten nie może przekroczyć 
wartości dopuszczalnej w sześcianie metrycznym 
danego stopnia kwantowania k. W celu oszacowania 
tego błędu, przy określeniu strategii chodowych 
obiektu B każdej strategii chodowej Z/eZ przy¬ 
porządkowuje się — oprócz kierunku charak¬ 
teryzującego daną strategię — również pewien sektor 
o długości promienia r bk . Takie przyporządkowanie 
łączy się z podziałem na sektory omówionej już 
wyżej kuli o promieniu r bk i o środku, w którym 
w chwili 4 >i _ 1 znajduje się obiekt B. Ułatwia to 
oszacowanie błędu popełnionego w identyfikacji 
położenia obiektu B w następnej dyskretnej chwili 
4, i, na podstawie pewnych wielkości zwanych para¬ 
metrami błędu X i 8. Sektory strategii chodowych 
obiektu B oraz parametry błędu X i 8 pokazano 
poglądowo na ryc. 40. Parametr X charakteryzuje 
odchylenie rzeczywistego kierunku, na którym znaj¬ 
duje się obiekt B w dyskretnej chwili 4 >t , od kierunku 
określonego strategią chodową z s e Z. Natomiast 
parametr 8 charakteryzuje skrócenie promienia r bk 
w wyniku nieprostoliniowego toru ruchu obiektu B. 

Wartość parametrów X i 8 jest ustalana na pod¬ 
stawie uzyskanej od urządzenia radarowego infor¬ 
macji o położeniu obiektu B w danej dyskretnej 
chwili t. Aktualna wartość parametrów X i 8 umoż¬ 
liwia określenie przez automat rozgrywający su¬ 
marycznego błędu A k (X, 8), jaki został popełniony 
w procesie identyfikacji rzeczywistego położenia 
obiektu B w chwili t. Wymiarem błędu sumarycz¬ 
nego A k (X, 8) jest odległość punktu w przestrzeni, 
w którym w danej chwili t znajduje się obiekt B, 
od punktu, w którym obiekt B powinien się znajdo¬ 
wać zgodnie z przyjętymi regułami gry. 



Tak, jak to było powiedziane wyżej, automat 
rozgrywający steruje działaniem obiektu A zgodnie 
z takim jednostronnie zoptymalizowanym den- 
drytem d J} składowym dendrytu D, który jest przy¬ 
porządkowany sytuacji, jaka wystąpiła w momencie 
rozpoczęcia procesu pościgu w sześcianie metrycz¬ 
nym o danym stopniu kwantowania k. Osiągnięcie 
przez wielkość A*(X, 5) ustalonej wartości granicznej 
oznacza, że dalsze sterowanie obiektem A według 
dendrytu djE D jest niedopuszczalne i powinno 
nastąpić przejście do innego dendrytu d,e D opisa¬ 
nego tym samym parametrem g r , lecz innym para¬ 
metrem p t . 

Takie przejście między dendrytami jest konsek¬ 
wencją naruszenia reguł gry w wyniku błędu popeł¬ 
nionego przez automat. Całkowite wyeliminowanie 
błędu określonego wielkością A k (k, S) następuje przy 
przejściu procesu pościgu z sześcianu metrycznego 
o stopniu kwantowania k do sześcianu metrycznego 
o stopniu kwantowania k+ 1, gdyż nowy cykl gry 
rozpoczyna się zawsze względem rzeczywistego po¬ 
łożenia obiektu B. Wymienione parametry błędów, 
jak również inne nie wymienione tutaj czynniki, 
pociągają za sobą konieczność nałożenia na struk¬ 
turę jednostronnie zoptymalizowanego dendrytu 
D — {di, d 2 , ..., dj, ..., d„) dodatkowych grafów. 

Jednostronnie zoptymalizowany dendryt gry wraz 
z nałożonymi na niego dodatkowymi grafami y 'na¬ 
zwiemy umownie grafem pościgu. 


Automat rozgrywający — sterujący obiektem 
w procesie pościgu 

Postacią graficzną "modelu "matematycznego 
opisującego proces pościgu w przestrzeni jest graf 
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pościgu. Graf pościgu określa zdeterminowane dzia¬ 
łanie automatu sterującego obiektem A w procesie 
pościgu. Wierzchołki grafu oznaczone symbolami 
reprezentują stany wewnętrzne automatu, na¬ 
tomiast krawędzie grafu reprezentują sygnały wej¬ 
ściowe lub wyjściowe automatu, w zależności od 
tego czy opisane są one symbolami* typu z J} czy 
też y t . 

Graf pościgu najwygodniej jest przedstawić na 
płaszczyźnie walcowej, dzięki czemu można wykazać, 
że wierzchołek końcowy grafu pościgu jest jedno¬ 
cześnie jego wierzchołkiem początkowym. Rysowa¬ 
nie kompletnego grafu pościgu jest mało przydatne 
z praktycznego punktu widzenia, gdyż zamiast tego 
wygodniej jest wyrazić go postacią numeryczną, 
tj. przy pomocy odpowiednich tablic. 

Natomiast bardzo istotna jest znajomość struk¬ 
tury grafu pościgu, gdyż określa ona jednocześnie 
strukturę i sposób działania automatu sterującego 
obiektem A. Strukturę grafu pościgu przedstawiono 
poglądowo na ryc. 42. Wyróżnia się w niej nastę¬ 
pujące podgrafy: 

1. Dendryt d Q początkowych położeń obiektów, 
składający się z wierzchołka B° c i z krawędzi opi¬ 
sanych parametrami p t ; 

2. Dendryty składowe djsD tworzące dendryt D, 
z których każdy posiada przyporządkowany sobie 
oddzielny wierzchołek początkowy Bf; 

3. Dendryty uzupełniające u u u 2 , u 3i ..., zapew¬ 
niające przejście gry ze stopnia kwantowania k 
do k+ 1. Wierzchołki początkowe tych dendrytów 
są wierzchołkami końcowymi pB" i p A” den¬ 
drytów djG D; 

4. Krawędzie przejść między dendrytami djSD 
uwarunkowane dużą wartością błędu sumarycznego 

8 ). 
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Podstawową częścią grafu pościgu jest dendryt 
D — {di , d 2 , dj, ..., d v }, który w Równej mierze 
rzutuje na strukturę automatu rozgrywającego. Na¬ 
tomiast pozostałe podgrafy grafu pościgu rzutują 
na sterowanie strukturą automatu rozgrywającego. 

Struktura automatu rozgrywającego jest jak 
gdyby pewnym fizycznym modelem struktury den¬ 
drytu D. Od wielkości dendrytu D zależą rozmiary 
modelującego ten dendryt automatu rozgrywającego. 
Bardzo istotna jest więc minimalizacja struktury 
dendrytu D w celu określenia zminimalizowanej 
struktury automatu rozgrywającego. Minimalizacja 
dendrytu D sprowadza się do zmniejszenia liczby 
jego wierzchołków i krawędzi. Ponieważ dendryt D 
jest zbiorem dendrytów składowych d,, minimali¬ 
zacji podlega każdy dendryt tego zbioru. 

Minimalizacja pojedynczego dendrytu składowego 
djSD polega na ustaleniu jego izomorficznych 
części składowych, tj. części opisanych tymi samymi 
elementami Zj i y t , a następnie nałożeniu tych 
części na siebie. Czynność tę wykonuje komputer. 
Dokonując porównania dwóch dowolnych zmini¬ 
malizowanych dendrytów djeD i d r e D można 
stwierdzić, że mają one strukturę częściowo lub 
całkowicie izomorficzną (tj. podobną). Istnieje więc 
możliwość nałożenia na siebie wszystkich zmini¬ 
malizowanych dendrytów dj wchodzących w skład 
dendrytu D. W wyniku przeprowadzenia takiej 
operacji struktura dendrytu D zostanie zreduko¬ 


wana do struktury tylko jednego ściśle określonego 
dendrytu d t e D. Zminimalizowany w ten sposób 
dendryt D nazwiemy dendrytem wynikowym i ozna¬ 
czymy go symbolem D k . Aby można było posłu¬ 
giwać się dendrytem D k = d y w odniesieniu do 
wszystkich możliwych dendrytów dj e D, należy 
określić zależności między elementami z } , y t , opisu- 
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jącymi strukturę dendrytu d k = D k , a elementami 
Zj, y u opisującymi strukturę dowolnie innego den¬ 
drytu dj. Określenie takiej zależności umożliwia 
z kolei określenie sposobu sterowania automatu 
samym sobą. Konieczność takiego sterowania wy¬ 
nika z tego, że program działania automatu rozgry¬ 
wającego jest określony strukturą automatu, w więc 
jest programem sztywnym. 

Sterując odpowiednio strukturą automatu do¬ 
stosowujemy program jego działania do wszystkich 
tych sytuacji, które mogą zaistnieć w procesie pościgu. 

Schemat blokowy automatu rozgrywającego, ste¬ 
rującego obiektem w procesie pościgu, przedsta¬ 
wiono na ryc. 43. Z rysunku widać, że w strukturze 
tego typu automatu wyróżnia się cztery podstawowe 
bloki funkcjonalne: 1. Automat wielostopniowy, 2. 
Sterowanie, 3. Wejście, 4. Wyjście. 

Automat wielostopniowy jest automatem skoń¬ 
czonym modelującym strukturę grafu D k , który 
jest wynikiem minimalizacji jednostronnie zopty¬ 
malizowanego dendrytu D. Składa się on z auto¬ 
matów jednostopniowych, z których każdy przy¬ 
porządkowany jest oddzielnemu piętru grafu D k 
(por. rozdział 5). 

Program działania automatu wielostopniowego 
jest określony strukturą automatu — jest to pro¬ 
gram sztywny, a jego obrazem graficznym jest den- 
dryt d x = D k . Sterując strukturą automatu wielo¬ 
stopniowego można zmienić program jego dzia¬ 
łania z d x = D k na dowolnie inny, określony przez 
djtD przy j* 1. Inaczej mówiąc, w wyniku stero¬ 
wania samym sobą automat rozgrywający ma moż¬ 
liwość dostosowania swojej struktury do zmodelo- 
wania takiego dendrytu d J} który dla danej sytuacji 
powstałej w procesie pościgu jest programem opty¬ 
malnego sterowania obiektem A. 
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Zadanie to spełnia blok sterowania. Oprócz wy¬ 
mienionego, do ważniejszych zadań realizowanych 
przez blok sterowania należy zaliczyć: 1. Kwanto¬ 
wanie w czasie procesu pościgu przez wypracowanie 
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Ryc. 43 

dyskretnych momentów czasu działania automatu 
wielostopniowego; 2. Sterowanie działaniem auto¬ 
matu wielostopniowego w funkcji wartości odchy¬ 
lenia A k (X, 8); 3. Wypracowywanie sygnału zmiany 
prędkości V A ; 4. Sterowanie wejściem i wyjściem 
automatu rozgrywającego. 


218 



Podstawowymi elementami bloku sterowania są: 
generator impulsów taktowych, licznik stopnia 
kwantowania k, licznik posunięć n, liczniki para¬ 
metrów p h g r , K 8, A k (k, 8). 

Głównym zadaniem bloku wejścia automatu roz¬ 
grywającego jest realizacja funkcji zamiany strategii 
chodowych typu z_, e Z na fikcyjne strategie cho¬ 
dowe Sj e S (por. w 3 rozdziale podrozdział „Gry 
wielochodowe parametryczne”). Wiadomo, że 
w omawianym procesie pościgu strategie chodowe 
Zj€ Z dotyczą pewnych wyróżnionych kierunków 
przemieszczania się w przestrzeni obiektu B, który 
w wielochodowej grze parametrycznej reprezentuje 
gracza B. 

Na wejściu automatu rozgrywającego strategie 
chodowe z s eZ mają postać sygnałów elektrycznych 
— impulsów prądowych lub napięciowych. Sygnały 
te wytwarzane są przez odpowiednie układy elektro¬ 
niczne urządzenia radarowego, znajdującego się 
w obiekcie A. Dla uproszczenia rozważań można 
przyjąć, że na wejściu automatu rozgrywającego 
każdej strategii chodowej ZjgZ przyporządkowany 
jest oddzielny przewód (ryc. 43). Jeżeli więc w czasie 
T t = ti-ti -1 obiekt B wykonał strategię chodową 
z T 6 Z, to od urządzenia radarowego na przewód z r 
bloku wejścia podawany jest impuls napięcia przed¬ 
stawiający sygnał jedynkowy. Sygnał ten przewodem 
z r wchodzi do bloku wejścia. Blok wejścia zbudo¬ 
wany jest ze złożonych układów logicznych, które 
pod działaniem sygnałów sterujących pochodzących 
z bloku sterowania kierują sygnał z T na odpowiedni 
przewód wyjściowy bloku wejścia. Przewody wyjścia 
bloku wejścia opisane są symbolami s u s 2 , ..., s t , 
..., s g , z których każdy reprezentuje odpowiedni 
sygnał wejściowy automatu wielostopniowego. Wia¬ 
domo, że obrazem graficznym działania automatu 
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wielostopniowego jest dendryt wynikowy D k . Kra¬ 
wędzie dendrytu D k są opisane symbolami fikcyjnych 
strategii chodowych graczy, tj. symbolami SjeS 
dla gracza B i w t e W dla gracza A (por. wyrażenie 
3.11. i 3.12). Pojawienie się na wejściu automatu 
rozgrywającego w danej dyskretnej chwili t t sygnału 
z r jeszcze nie określa jednoznacznie sygnału wej¬ 
ściowego automatu wielostopniowego. Aby ten syg¬ 
nał można było określić, z bloku sterowania na blok 
wejścia podawane są następujące sygnały sterujące: 

— sygnał p t , wyrażający informację o położeniu 
początkowym obiektów w sześcianie metrycznym 
o aktualnym stopniu kwantowania k; 

— sygnał g r , przedstawiający informację o wartości 
stosunku prędkości V A j V B ; 

— sygnał n, wskazujący numer kolejnego posu¬ 
nięcia w grze opisującej proces pościgu w sze¬ 
ścianie metrycznym o aktualnych wartościach 
parametrów k , p t , g r . 

Wymienione trzy sygnały p h g r , n, podawane na 
blok wejścia, wyznaczają dla sygnału z r drogę prze¬ 
pływu na jedno tylko ściśle określone wyjście typu s Jt 
co jest jednoznaczne z zamianą strategii chodowej z r 
na strategię Sj (por. ryc. 43). 

W podobny sposób, jak blok wejścia, działa blok 
wyjścia automatu rozgrywającego. Blok wyjścia- 
zamienia sygnały wyjściowe automatu wielostopnioa 
wego, oznaczone na ryc. 43 symbolami w, e W, n a 
sygnały y t e Y będące strategiami chodowymi gracz 
A, a tym samym decyzjami do działania obiektu A 

Wypracowane przez automat rozgrywający sygnały 
yi podawane są na odpowiednie urządzenia wyko¬ 
nawcze obiektu A, które sterują kierunkiem lotu 
obiektu A, przy czym w każdej dyskretnej chwili tj 
na urządzenie wykonawcze podawany jest tylko 
jeden sygnał y t przynależny do zbioru Y. 
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Obiekt, wyposażony w, omówiony wyżej typ 
automatu skończonego, ma pełną autonomię w po¬ 
dejmowaniu decyzji wynikających z realizacji pro¬ 
cesu pościgu w przestrzeni. Uzasadnione staje się 
więc nazwanie go samodzielnym obiektem cyberne¬ 
tycznym, gdyż nie jest on sterowany z Ziemi, skąd 
co najwyżej może być kontrolowane tylko jego 
działanie. 

Scharakteryzowane na przykładzie procesu po¬ 
ścigu w przestrzeni działanie obiektu cybernetycz¬ 
nego w przestrzeni można uogólnić na całą klasę 
innych zadań, które mogą być wykonywane przez 
tego typu obiekty. W świetle tendencji rozwojowych 
cybernetyki i astronautyki przydatność użytkowa 
tych cybernetycznych obiektów jest niewątpliwie 
bardzo duża. 
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Diagnostyka i gry 


Jedną z dyscyplin naukowych związanych obec¬ 
nie ściśle z cybernetyką jest diagnostyka. Wynika 
to m.in. z tego, że domeną zainteresowań cybernetyki 
są systemy z zachowaniem celowym oraz zachodzące 
w tych systemach procesy samosterowania. Z kolei 
wiadomo, że dowolny system z zachowaniem celo¬ 
wym będzie funkcjonował właściwie tylko wtedy, 
gdy będzie sprawny. Jeżeli system jest niesprawny, 
jego działanie przestaje być celowe, a w najlepszym 
przypadku nie jest ono optymalne. Zachodzi więc 
konieczność ustalenia przyczyn niesprawności sys- 
stemu. Ponieważ system jest na ogół zbiorem ele¬ 
mentów powiązanych ze sobą określonymi relacjami, 
ustalenie źródła niesprawności systemu związane 
będzie z lokalizacją uszkodzonego elementu. Dyscy¬ 
pliną naukową zajmującą się metodami lokalizacji 
źródeł niesprawności w systemach jest właśnie 
diagnostyka. Proces polegający na praktycznym 
wykorzystaniu jednej z metod diagnostyki do usta¬ 
lenia źródła niesprawności w systemie nosi nazwę 
procesu diagnostycznego, a jego wynikiem jest 
diagnoza. 

Diagnostykę możemy podzielić na medyczną i tech¬ 
niczną, W diagnostyce medycznej obiektem badań 
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są organizmy żywe, a w szczególności organizm 
człowieka, natomiast w diagnostyce technicznej 
obiektem badań są urządzenia techniczne. W cy¬ 
bernetyce abstrahuje się bardzo często od wymienio¬ 
nego podziału diagnostyki i rozpatruje się ją w ujęciu 
ogólnym, przyjmując, że obiektami badań są systemy 
z zachowaniem celowym. Systemy te są na ogół 
spójne. System spójny charakteryzuje się tym, iż 
każdy funkcjonalny element systemu jest w taki 
sposób związany z innymi, że zmiana stanu w tym 
elemencie wywołuje zmianę stanu systemu. W syste¬ 
mie można wyróżnić dwa rodzaje stanów: stany 
diagnostyczne i stany funkcjonalne. Stany funkcjo¬ 
nalne systemu wynikają z funkcji opisujących dzia¬ 
łanie systemu. Natomiast stany diagnostyczne sy¬ 
stemu są określone przez stopień sprawności sy¬ 
stemu. Stany diagnostyczne systemu możemy po¬ 
dzielić na makrostany diagnostyczne, tj. makro- 
stan E — system sprawny oraz makrostan C — sy¬ 
stem niesprawny. System znajduje się w makro- 
stanie E, jeżeli wszystkie elementy systemu są sprawne. 
Podobnie system będzie znajdować się w makro- 
stanie C, jeżeli co najmniej jeden z jego elementów 
będzie niesprawny. Makrostan C jest następującym 
zbiorem stanów diagnostycznych 

C — {Cj, ^2, Cl, ..., Cy) (8.1) 

gdzie c t — i-ty stan diagnostyczny, sygnalizujący 
uszkodzenie jednego z elementów systemu. 

Diagnostyka łączy się ściśle z kontrolą sprawności 
systemu. Zadaniem kontroli sprawności systemu 
jest określenie aktualnego makrostanu diagno¬ 
stycznego. Jeżeli aktualnym makrostanem jest C, 
wówczas powinien nastąpić proces diagnostyczny 
sprowadzający się do określenia aktualnego stanu 
diagnostycznego Ci e C. 
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W celu określenia aktualnego stanu diagnostycz¬ 
nego c t e C należy wykonać cały ciąg operacji spraw¬ 
dzających tak, aby na podstawie otrzymanych wy¬ 
ników (odpowiedzi systemu na operacje sprawdza¬ 
jące) można było zlokalizować uszkodzenie w syste¬ 
mie. Trudność rozwiązania tego zadania polega 
na podjęciu decyzji, jakie operacje sprawdzające 
należy zastosować i w jakiej kolejności. 

Ciąg operacji sprawdzających dla systemu bę¬ 
dącego obiektem diagnostycznym przyjęto nazywać 
pełnym testem diagnostycznym, natomiast poje¬ 
dyncze operacje sprawdzające przyjęto nazywać tes¬ 
tami elementarnymi. Zbiór elementarnych testów 
diagnostycznych dla danego obiektu diagnostycz¬ 
nego (systemu) jest z reguły zbiorem skończonym. 
Zbiór ten symbolicznie oznaczymy jako 

Y = {y lt y 2 , .... y t , .... y w } (8.2) 

Na każdy elementarny test diagnostyczny y t e Y, 
doprowadzony w taki czy inny sposób na odpo¬ 
wiednie wejście obiektu diagnostycznego, następuje 
określona reakcja obiektu diagnozowanego, będąca 
pewną formą odpowiedzi tego obiektu na zadany 
test. Odpowiedzi obiektu diagnostycznego na po¬ 
jedyncze elementarne testy diagnostyczne noszą nazwę 
symptomów elementarnych. Z kolei na podstawie 
ściśle określonego ciągu symptomów elementarnych 
można jednoznacznie ustalić źródło niesprawności 
w diagnozowanym obiekcie (systemie). Symptomy 
elementarne tworzą zbiór skończony 

Z =» {zj, z 2 , ..., Zj, ..., Zg} (8.3) 

Przy badaniu obiektu diagnostycznego niewłaściwą 
sekwencją testów elementarnych, odpowiedź obiektu, 
reprezentowana określoną sekwencją symptomów 
elementarnych, uniemożliwia lokalizację źródła nie- 
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sprawności w obiekcie. Zachodzi więc potrzeba 
opracowania odpowiedniej metody wyboru opty¬ 
malnych testów elementarnych tak, aby ich sekwencja 
doprowadziła do takiej sekwencji odpowiedzi obiektu 
diagnostycznego, która jednoznacznie określa źródło 
niesprawności. Stąd też proces diagnostyczny naj¬ 
dogodniej jest opisać postacią dwuosobowej gry 
wielochodowej. Grę taką będziemy nazywać grą 
diagnostyczną. W grze diagnostycznej występuje 
dwóch graczy: gracz B, będący obiektem diagno¬ 
zowanym, oraz gracz A, dążący do odgadnięcia aktu¬ 
alnego stanu diagnostycznego obiektu B. 

Ze względu na automatyzację procesu diagno¬ 
stycznego, graczem A powinien być pewien automat 
diagnostyczny działający zgodnie z regułami pro¬ 
wadzenia gry wielochodowej. Celem gry jest iden¬ 
tyfikacja stanu diagnostycznego obiektu B przez 
gracza A. W tym też celu gracz A będzie dążył do 
określenia stanu obiektu B drogą testowania obiektu B 
ciągiem pytań — testów elementarnych. Przy odpo¬ 
wiednim doborze ciągu testów elementarnych, ciąg 
odpowiedzi obiektu B powinien jednoznacznie okreś¬ 
lić jego stan diagnostyczny. Gra diagnostyczna jest 
grą z naturą, gdyż obiekt B nie jest zainteresowany 
w zatajeniu swego stanu. Odpowiedzi obiektu B na 
elementarne testy zadawane przez gracza A są pew¬ 
nymi elementarnymi symptomami stanu, w jakim 
znajduje się obiekt B. Gdy elementarne testy dia¬ 
gnostyczne będą przez gracza A dobrane niewłaści¬ 
wie, nie będzie on mógł odgadnąć, na podstawie 
uzyskanych od obiektu B odpowiedzi-symptomów, 
właściwego stanu tego obiektu i wówczas grę prze¬ 
grywa. 

Przy właściwym doborze testów elementarnych 
gracz A grę wygrywa, gdyż odpowiedzi-symptomy 
obiektu B jednoznacznie określają jego stan. Wy- 
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grana gracza A będzie tym większa, im będzie mniej¬ 
sza liczba testów elementarnych wykorzystanych 
przez gracza A dla zidentyfikowania danego stanu 
diagnostycznego obiektu B. 

Schemat blokowy układu złożonego z automatu 
diagnostycznego A i obiektu diagnozowanego B 
przedstawiono na ryc. 44. Automat A jako strona 



Diagnozy optymalne 


Ryc. 44 

gry dysponuje zbiorem strategii chodowych Y y 
określonym przez wyrażenie (8.2), natomiast obiekt 
diagnozowany B dysponuje zbiorem strategii cho¬ 
dowych Z, określonym wyrażeniem (8.3). Zbiór 
wyników końcowych diagnostycznej gry można uzy¬ 
skać ze zbioru C przez uzupełnienie go elementem 
„pustym” e — zbiór ten będzie się przedstawiał 
następująco 

C = (c, Cj, C% j •••, Cj, ..., Cp) (&-4) 

Element „pusty” eeC' określa negatywny wynik 
gry dla gracza A, aktualny wtedy, gdy gracz zasto- 
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sował w grze błędną sekwencję swoich strategii 
chodowych. Graficzną postacią gry wielochodowej 
jest dendryt gry. Przykładowy fragment dendrytu 
gry diagnostycznej przedstawiono na ryc. 45. 
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Każdemu wierzchołkowi typu Bg dendrytu gry dia¬ 
gnostycznej, gdzie: n — piętro dendrytu, k — numer 
porządkowy wierzchołka w piętrze, przyporządko¬ 
wany jest pewien podzbiór stanów diagnostycznych, 
przynależnych do zbioru C. Wierzchołkowi począt¬ 
kowemu dendrytu B t ° przyporządkowany jest cały 
zbiór C. Krawędzie wychodzące ż wierzchołka 
początkowego dendrytu są opisane elementami 
Zj 6 Z, które reprezentują symptomy stanu diagno¬ 
stycznego i wykazują, w jakim podzbiorze zbioru C 
znajduje się aktualny stan diagnostyczny obiektu B. 

W procesie realizacji gry diagnostycznej następuje 
stopniowe zawężanie zbioru C aż do momentu, 
gdy w zawężonym zbiorze C znajdzie się tylko jeden 
element CjsC i to taki, który sygnalizuje aktualny 
stan diagnostyczny obiektu B. 

Zbiór C możliwych stanów diagnostycznych 
charakteryzuje się tym, że każdy element Cj tego 
zbioru przyporządkowany jest tylko jednemu ele¬ 
mentowi Xj wchodzącemu w skład obiektu diagno¬ 
zowanego B. Jeżeli dany element Xj obiektu diagno¬ 
zowanego B jest uszkodzony, to stan diagnostyczny Cj 
przyporządkowany temu elementowi jest elementem 
wyróżnionym w zbiorze C. Stąd też po określeniu 
w procesie realizacji gry diagnostycznej aktualnego 
stanu diagnostycznego c } obiektu B , jednoznacznie 
zostanie zlokalizowany uszkodzony element. Po 
zlokalizowaniu uszkodzonego elementu x } obiektu B, 
automat diagnostyczny A powinien wytworzyć syg¬ 
nał zakończenia procesu diagnostycznego ze wska¬ 
zaniem wyniku tego procesu, tzn. optymalnej diagno¬ 
zy. W dendrycie gry diagnostycznej sygnał ten jest 
reprezentowany strategią chodową y(cj), tzn. stra¬ 
tegią przyporządkowaną danemu wierzchołkowi koń¬ 
cowemu. 

Dla ilustracji tego zagadnienia rozpatrzmy frag- 
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ment dendrytu gry diagnostycznej, przedstawiony 
na ryc. 45. Pierwszym sygnałem podawanym na 
wejście obiektu diagnozowanego B jest test kontrolny 
y 9 . Na test kontrolny y 9 następuje odpowiednia 
reakcja obiektu B, zgodnie z opisem krawędzi wy¬ 
chodzących z wierzchołka początkowego B 9 den¬ 
drytu gry. Zgodnie z dendrytem z ryc. 45 odpo¬ 
wiedź obiektu B na test kontrolny y 9 strategią cho¬ 
dową z 5 rozpoczyna dwuosobową grę wielochodową. 

Strategią chodową z 5 obiekt B sygnalizuje zbiór 
stanów diagnostycznych, w których obiekt B może 
się znajdować w wyniku powstałego uszkodzenia. 
Zbiór ten wynosi np. 

C = {c u c 2 , c 3 ] 

Po wykonaniu przez obiekt B strategii chodo¬ 
wej z 5 , sytuacja powstała w grze jest określona 
wierzchołkiem A\. W sytuacji A\ strona A gry dia¬ 
gnostycznej może zastosować test y u y 2 lub dowolną 
inną strategię chodową y t za zbioru Y. Zależnie od 
zastosowanych strategii chodowych przez gracza A 
gra znajdzie się w jednym z wierzchołków B\, B\ 
lub B). Po znalezieniu się gry w sytuacji określonej 
wierzchołkiem B\, B\ lub Ąf, obiekt diagnozy po¬ 
winien dokonać odpowiedzi na podany mu test 
elementarny y l5 y 2 lub y t . 

Załóżmy, że po pierwszym posunięciu w grze 
sytuacja znalazła się w wierzchołku B\ (ryc. 45). 
W sytuacji określonej tym wierzchołkiem obiekt B 
jako strona gry może zastosować strategię chodową z x 
lub z 2 . Zastosowanie przez obiekt B strategii cho¬ 
dowej z 2 oznacza, że obiekt B znajduje się w stanie 
diagnostycznym c a 6 C, co równoważne jest temu, 
że w obiektach B uszkodzony jest element x t . 
W tym przypadku gra znajdzie się w wierzchołku 
końcowym oznaczonym symbolem c l9 gdyż w wyniku 
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wykonania przez obiekt B strategii chodowej z 2 , 
zbiór stanów diagnostycznych {cj, c 2 , c 3 ] przy¬ 
porządkowanych wierzchołkowi B\ zredukowany 
został do zbioru jednoelementowego {c x }. Gdy 
stroną diagnostyczną będzie automat diagnostyczny 
(automat rozgrywający), to po znalezieniu się gry 
w wierzchołku końcowym, w naszym przypadku 
oznaczonym symbolem c u automat powinien gene¬ 
rować sygnał reprezentujący wynik procesu diagno¬ 
stycznego. 

Na ryc. 45 sygnał ten oznaczono symbolem X c i)- 
W interpretacji gry wielochodowej sygnały repre¬ 
zentujące wynik procesu diagnozy, tj. diagnozę, 
określać będziemy umownie terminem pseudo- 
strategii chodowych automatu. Dla rozpatrywanego 
przypadku zbiór pseudostrategii chodowych auto¬ 
matu diagnostycznego przedstawiałby się następu¬ 
jąco 

Y c = {y(ci), y(c 2 ), y(c 3 ), y(c 0 )} 

gdzie y(c 0 ) — negatywny wynik procesu diagno¬ 
stycznego. 

Rozpatrzmy z kolei przypadek, gdy w sytuacji 
określonej w dendrycie z ryc. 45 wierzchołkiem B l 
obiekt diagnozowany odpowiada strategią chodową z l 
na strategię chodową automatu y x . 

Dla przykładu przyjęto, że strategia chodowa z t 
oznacza, że uszkodzony jest element x 2 lub x 3 
obiektu, a więc nie określa ona jednoznacznie aktu¬ 
alnego stanu diagnostycznego. W przypadku więc 
zastosowania strategii chodowej z x zbiór stanów 
diagnostycznych {c lt c 2 , c 3 } zredukowany zostanie 
do zbioru { c 2 , c 3 }. Obiekt B swoją strategią cho¬ 
dową Zj jak gdyby sygnalizuje, że nie znajduje się 
w stanie diagnostycznym c 3 , stąd też stan ten pod¬ 
lega wykreśleniu ze zbioru stanów diagnostycznych. 
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Sytuacja powstała w grze teraz będzie określona 
wierzchołkiem A\. W sytuacji A\ strona A gry 
dokonuje wyboru strategii chodowych przypo¬ 
rządkowanych tej sytuacji. 

Na ryc. 45 pokazano, że optymalną strategią 
chodową dla strony A jest w tym przypadku stra¬ 
tegia y 2 . Zgodnie z tą ryciną odpowiedzią obiektu B 
na strategię y 2 może być tylko strategia chodowa z 3 
lub z 4 . Strategia chodowa z 3 wskazuje na stan dia¬ 
gnostyczny c 3 , a więc na uszkodzenie elementu x 3 
obiektu B, natomiast strategia chodowa z 4 na stan 
diagnostyczny c 2 , a więc na uszkodzenie elementu 
x 2 tego obiektu. Zastosowanie przez stronę A w sy¬ 
tuacji określonej wierzchołkiem A\ strategii cho¬ 
dowej innej niż y 2i jrp. yi lub y t , może nie dopro¬ 
wadzić do zlokalizowania uszkodzenia, a w naj¬ 
lepszym przypadku lokalizuje uszkodzenie po więk¬ 
szej liczbie posunięć w grze. W podobny do powyż¬ 
szego sposób można by przeanalizować wszystkie 
pozostałe ścieżki dendrytu przedstawionego na 
ryc. 45. 

Po zbudowaniu dendrytu gry diagnostycznej, opisu¬ 
jącej konkretny proces diagnozy, dendryt taki podlega 
jednostronnej optymalizacji na korzyść automatu 
diagnostycznego będącego jedną ze stron gry. Jedno¬ 
stronnie zoptymalizowany dendryt gry diagno¬ 
stycznej jest graficzną postacią algorytmu opty¬ 
malnego postępowania automatu w procesie dia¬ 
gnostycznym dotyczącym danego obiektu diagnozo¬ 
wanego. Oczywiste jest, że jednostronnie zopty¬ 
malizowanym dendrytem gry diagnostycznej można 
się pos&iżyć również przy lokalizacji źródła nie¬ 
sprawności w badanym obiekcie, nie korzystając 
z pomocy automatu rozgrywającego. 

Dla przykładu na iyc. 46 został przedstawiony 
jednostronnie zoptymalizowany dendryt gry diagno- 
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stycznej, powstały w wyniku jednostronnej opty¬ 
malizacji dendiytu z ryc. 45. 

W ogólnym przypadku gra wielochodowa opisu¬ 
jąca proces diagnostyczny jest grą parametryczną. 


Cj Cj 



Wynika to z tego, że obiekt diagnozowany naj¬ 
częściej dzieli się na pewne części składowe, z któ¬ 
rych każda charakteryzuje się swoistą strukturą 
i spełnia inną funkcję w obiekcie (systemie). Dla 
każdej z takich części składowych obiektu diagno¬ 
zowanego należy określić dendryt gry diagno¬ 
stycznej, a następnie go zoptymalizować. Uzyskamy 
w ten sposób jednostronnie zoptymalizowany den¬ 
dryt gry diagnostycznej składający się z całej rodziny 
dendrytów składowych, z których każdy dotyczy 
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procesu diagnostycznego innej części składowej da¬ 
nego obiektu. Z kolei każdemu pojedynczemu den- 
drytowi przyporządkowuje się oddzielny parametr Pi 
wyróżniający go w rodzinie dendrytów. 

Następnie, w celu uzyskania najbardziej zmini¬ 
malizowanej struktury dendrytu opisującego pro¬ 
ces diagnostyczny dla całego obiektu diagnozo¬ 
wanego, dendryty składowe odpowiednio nakłada 
się na na siebie (por. rozdział 3, podrozdział „Gry 
wielochodowe parametryczne”). Wynikiem końco¬ 
wym takiej operacji jest zminimalizowany dendryt 
gry diagnostycznej o jednym wierzchołku początko¬ 
wym, który w zależności od parametru p t repre¬ 
zentuje ten lub inny dendryt składowy. Zminima¬ 
lizowany dendryt gry diagnostycznej jest grafem 
automatu rozgrywającego (diagnostycznego) i umoż¬ 
liwia przeprowadzenie syntezy tego automatu. Auto¬ 
matem diagnostycznym może być również komputer 
mający program diagnostyczny opracowany na pod¬ 
stawie zminimalizowanego dendrytu gry diagno¬ 
stycznej. 
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Automatyzacja procesów decyzyjnych 
w ujęciu gry wielochodowej 


Wobec obserwowanego od kilku lat ciągłego 
i burzliwego rozwoju techniki obliczeniowej, szcze¬ 
gólnej wagi nabiera problem wykorzystania syste¬ 
mów cyfrowych w procesach kierowania. Dotyczy 
to zarówno problemu kierowania działalnością po¬ 
jedynczego przedsiębiorstwa przemysłowego, jak też 
kierowania złożonym układem ekonomicznym, takim 
jak kombinat, gałąź przemysłu, gospodarka naro¬ 
dowa itp. W ogólnym przypadku proces kierowania 
układem ekonomicznym jest procesem wieloetapo¬ 
wym, co wynika z charakteru funkcjonowania układu 
ekonomicznego jako układu z zachowaniem celowym. 
Kierowanie wieloetapowym procesem funkcjonowa¬ 
nia danego układu uwarunkowane jest koniecznością 
wypracowywania zarówno decyzji etapowych, jak 
i tzw. makrodecyzji, obejmujących kilka etapów 
wraz z kontrolą realizacji tych decyzji. Z kolei infor¬ 
macja o przebiegu realizacji decyzji przez przedmiot 
kierowania wskazuje na konieczność modyfikowa¬ 
nia realizowanych już decyzji przez nakładanie na 
nie tzw. mikrodecyzji. Kierowanie jest więc złożonym 
wieloetapowym procesem decyzyjnym o charakterze 
dynamicznym. Jakość tego kierowania zależy od 
stopnia optymalności podejmowanych decyzji. Przy 
uwzględnieniu różnorodnych czynników rzutują¬ 
cych na funkcjonowanie układu ekonomicznego. 
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wybór jakiejkolwiek optymalnej decyzji do kiero¬ 
wania takim układem może być przeprowadzony 
tylko przy pomocy systemu cyfrowego (komputera). 
Jednak nawet najbardziej nowoczesny pod wzglę¬ 
dem technicznym system cyfrowy będzie bezuży¬ 
teczny w procesie wypracowywania optymalnych 
decyzji, jeżeli nie określi się algorytmu jego działa¬ 
nia w procesie kierowania danym układem ekono¬ 
micznym. Stąd też wynika konieczność określenia 
takiego modelu systemu przetwarzającego informacje 
w wieloetapowym procesie decyzyjnym, który bę¬ 
dąc algorytmem działania systemu cyfrowego — 
traktowanego pierwotnie jako zbiór urządzeń cyfro- 
wych — rzutowałby jednocześnie na architekturę 
systemu cyfrowego. 

Zagadnienie to, dotychczas nie rozpracowane, 
wysuwa się na pierwszy plan w problematyce zwią¬ 
zanej z kierowaniem gospodarką narodową. Uza¬ 
sadnione są więc prace dążące do jego rozwiązania. 

Jedna z możliwych do przyjęcia koncepcji roz¬ 
wiązania tego problemu opiera się na syntezie gry 
wielochodowej opisującej proces decyzyjny. 

W celu uogólnienia problemu kierowania układem 
z zachowaniem celowym przy pomocy systemu 
cyfrowego, załóżmy, że proces kierowania dotyczy 
pewnego układu- abstrakcyjnego Q , którego szcze¬ 
gólnym przypadkiem jest układ ekonomiczny. 
Układ Q jest zbiorem pewnych obiektów będących 
składnikami układu. 

Zbiór ten ma postać 


Q = {X u X 2 , ..., X u ..., X m } (9.1) 

gdzie X t — /-ty obiekt układu Q. 

Gdy układ Q jest układem ekonomicznym, wów¬ 
czas obiektami X t e Q są zakłady wytwórcze bądź 
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też jednostki spełniające rolę pomocniczą, jednakże 
niezbędną dla należytego funkcjonowania układu. 
Każdy z obiektów X t e Q stanowi źródło przypo¬ 
rządkowanej mu informacji i jest odbiornikiem de¬ 
cyzji wypracowanej przez system cyfrowy. 

Układ Q zgodnie ze swym przeznaczeniem re¬ 
alizuje pewne przedsięwzięcie według określonego 
z góry kryterium efektywności. Aktualny stan układu 
określają parametry, przynależne do pewnych dzie¬ 
dzin rzutujących na funkcjonowanie układu. Każda 
dziedzina z osobna określa pewną klasę przedsię¬ 
wzięć lub klasę środków potrzebnych do funkcjo¬ 
nowania układu lub też klasę innych czynników 
mających wpływ na funkcjonowanie układu. Dla 
układu ekonomicznego dziedziną może być pro¬ 
dukcja, transport, zaopatrzenie itp. 

Dziedziny tworzą zbiór 

T = {A, B, C, ..., /} (9.2) 

Informacje o stanie układu Q w poszczególnych 
dziedzinach wchodzących w skład zbioru r jedno¬ 
znacznie określa kompletny stan układu Q. 

Ponieważ zgodnie z wyrażeniem (9.1) układ Q 
jest zbiorem obiektów, każdy obiekt X t posiada 
przyporządkowany mu zbiór dziedzin, w zakresie 
których funkcjonuje. Zbiór ten ma postać 

T, = {A t , B t , Ć„ ..., M h Ńi} (9.3) 

przy czym elementy tego zbioru jako dziedziny 
wchodzą w zakres odpowiednich dziedzin zbioru F. 
Stąd też dowolna dziedzina zbioru T jest jedno¬ 
cześnie sama zbiorem dziedzin przyporządkowanych 
poszczególnym obiektom X t e Q. Na przykład dzie¬ 
dzina A zbioru T określa zbiór o postaci 

A == {Al, ^ 2 ) •••> Ai, ..., ( 9 - 4 ) 
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Z kolei każda dziedzina A t e A jest zbiorem moż¬ 
liwych stanów danego obiektu X t w dziedzinie A t . 

Informacja o stanie danego obiektu X t we wszyst¬ 
kich przyporządkowanych mu dziedzinach będących 
elementami zbioru r 4 jednoznacznie określa kom¬ 
pletny stan obiektu X t w danej dyskretnej chwili. 
Natomiast informacja o stanie wszystkich jednostek 
X t (dla i = 1, 2 m) w jednej i tej samej dzie- 

dżinie, np. A, jednoznacznie określa stan układu Q 
w tej dziedzinie. 

Stan ten zadany jest wektorem o postaci 

® = &2,J2i •••? ®l,Jh •••» a m,jm\ ( 9 . 5 ) 

gdzie a ul — aktualny stan obiektu X t w dziedzi- 
nie A t . 

Znając również aktualny stan układu Q w pozo¬ 
stałych dziedzinach zbioru można określić kom¬ 
pletny stan układu Q. Stan ten zadany jest wektorem 

z = [a, b , c, ..., p ] (9,6) 

Współrzędnymi tego wektora są wektory o postaci 
zadanej wyrażeniem (9.5). 

Na podstawie informacji o aktualnym stanie 
układu Q, system cyfrowy — kierujący optymalnym 
działaniem układu Q — powinien wypracować 
odpowiednią decyzję. Decyzja ta ma postać wektora 

y = [y a , y b , y c , •••> y P ] (9.7) 

Współrzędne wektora y są decyzjami do sterowa¬ 
nia układem Q w zakresie poszczególnych dziedzin. 
Ponieważ układ Q jest układem z zachowaniem 
celowym i działa w funkcji czasu, decyzja co do 
kierowania układem Q nie może być wypracowana 
bezpośrednio tylko na podstawie informacji o aktu¬ 
alnym stanie układu. Przy wypracowywaniu opty- 
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malnej decyzji na podstawie informacji z = z(tj) 
charakteryzującej stan układu Q w danej chwili t s 
musi być uwzględniona również sekwencja stanów 
układu i decyzji wypracowanych przez system cyf¬ 
rowy w poprzednich dyskretnych chwilach 

0- 1> tj-2i •••» t 2 , *1 

oczywiście przy założeniu, że znany jest algorytm 
reakcji systemu cyfrowego na stany układu Q w na¬ 
stępnych chwilach 

ty +ij tj+ 2 5 ••• 

Wnioski wynikające z przeprowadzonej powyżej 
analizy rzutują na złożoność systemu przetwarza¬ 
jącego, odwzorowującego sposób funkcjonowania 
systemu cyfrowego w dyskretnym, wieloetapowym 
procesie przetwarzania informacji i wypracowywa¬ 
nia decyzji dla kierowania układem Q. 

Z punktu widzenia obiegu informacji, przetwa¬ 
rzania informacji i wypracowywania decyzji, system 
przetwarzający informację można traktować jako 
przestrzeń zbiorów, której elementami są zbiory 
informacji, zbiory decyzji oraz zbiór algorytmów 
odwzorowań między zbiorami. Z tych też wzglę¬ 
dów wydaje się celowe przyjęcie dla tego systemu 
grafów skierowanych jako języka strukturalnego, 
ponieważ graf skierowany najlepiej uwidacznia 
właściwości funkcjonalne systemu przetwarzającego 
informację, jak również ułatwia jego syntezę. 

Podstawowe funkcje systemu cyfrowego, wypraco¬ 
wującego optymalne decyzje w wieloetapowym pro¬ 
cesie decyzyjnym, można wyjaśnić na podstawie 
schematu funkcjonalnego odpowiadającego mu sy¬ 
stemu przetwarzającego informację (ryc. 47). Źród¬ 
łami informacji dla systemu cyfrowego są obiekty X t 
wchodzące w skład danego układu Q będącego 
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przedmiotem kierowania. Informacja wchodząca do 
systemu cyfrowego charakteryzuje stan obiektów 
X[ e Q w poszczególnych dziedzinach funkcjonowania 
tych obiektów. Ze względu na rodzaje decyzji wy- 



Legenda 

- Kanał odwzorowania 

Kilka kanałów odwzorowania 
Przepływ Informacji 

Ryc. 47 

stępujących w procesie kierowania układem Q, 
informacja napływająca do systemu cyfrowego pod¬ 
lega selekcji sprowadzającej się do podziału tej 
informacji na dwa typy, tj. J u J 2 . 

Na podstawie informacji typu Ą wypracowana jest 
decyzja co do kierowania układem Q bez uwzględ- 
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nienia funkcji czasu. Natomiast informacja typu J 2 
rzutuje na wypracowanie decyzji do kierowania 
układem Q z uzwzględnieniem funkcji czasu. Wy¬ 
pracowana przez system cyfrowy decyzja y = f(Ą), 
tj. na podstawie informacji J lt podlega w systemie 
analizie, której wynikiem są decyzje do kierowania 
obiektami X t w zakresie poszczególnych dziedzin. 

Bardziej złożonemu procesowi przetwarzania pod¬ 
lega informacja typu J 2i gdyż na niej opiera się cały 
wieloetapowy proces decyzyjny. Złożoność tego prze¬ 
twarzania jest uwarunkowana koniecznością prze¬ 
prowadzenia w systemie cyfrowym zarówno syn¬ 
tezy informacji kompletnej, jak również syntezy 
decyzji (por. ryc. 47). 

Celem syntezy informacji jest określenie ogólnego 
stanu układu Q we wszystkich dziedzinach jego 
funkcjonowania. Informacja charakteryzująca ten 
stan jest wektorem o postaci wyrażenia (9.6) i kom¬ 
pletuje zbiór Z możliwych stanów układu Q. Zbiór Z 
jest określony następującą postacią 

Z = Ol, Z 2) •••) Zjf (^‘^) 

Jednocześnie z syntezą informacji następuje syn¬ 
teza decyzji. Polega ona na tym, że te elementy 
informacji typu J 2 , które są wykorzystywane do 
określenia ogólnego stanu układu Q, odwzorowy¬ 
wane są również w odpowiadające im decyzje. De¬ 
cyzje te kompletują odpowiednie zbiory decyzji, 
a następnie podlegają procesowi syntezy na decyzje 
etapowe. Decyzje etapowe są określone postacią 
wyrażenia (9.7) i kompletowane w zbiorze 

Y = y 2 , yj, ..., y w } (9.9) 

W zasadzie zarówno zbiór Y, jak i zbiór Z kom¬ 
pletowane są w okresie wstępnego uruchomienia 
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systemu cyfrowego symulującego możliwe warianty 
działania układu Q. Po tym wstępnym okresie 
w zbiorze Y powinny się znaleźć „prawie” wszystkie 
możliwe decyzje etapowe do kierowania układem Q 
na podstawie informacji o aktualnym stanie tego 
układu. 

Jednocześnie z procesem kompletowania zbiorów 
Z i Y zostają określone relacje między elemen tami 
obydwóch zbiorów. Znając zbiory Ził, relacje 
między elementami tych zbiorów oraz kryterium 
efektywności funkcjonowania układem Q można 
określić model matematyczny kierowania układem Q. 
Ze względu na wieloetapowy proces decyzyjny, 
warunkujący funkcjonowanie układu Q, celowe się 
staje wyrażenie tego modelu postacią dwuosobowej 
gry wielochodowej. 

Stroną / tej gry jest układ Q funkcjonujący 
w zbiorze przyporządkowanych mu dziedzin, na¬ 
tomiast stroną II tej gry jest system cyfrowy wypra¬ 
cowujący optymalne decyzje etapowe. 

Układ Q jako jedna strona ze stron gry jest gene¬ 
ratorem informacji dla systemu cyfrowego, na pod¬ 
stawie której jest określony kompletny stan układu Q. 
Ponieważ dowolny, kompletny stan układu Q okreś¬ 
la się jednoznacznie na podstawie informacji o stanie 
układu w poszczególnych dziedzinach zawierają¬ 
cych również elementy o charakterze losowym, 
stronę I gry można potraktować w pewnym sensie 
jako naturę. Z kolei, uwzględniając zdeterminowany 
charakter działania systemu cyfrowego, stronę II 
gry należy potraktować jako rozumnego gracza. 
Wartością gry dla przyjętego modelu jest pewien 
współczynnik k określający stopień optymalności 
stanu układu Q. Biorąc pod uwagę wszystkie czyn¬ 
niki losowe mające wpływ na działanie układu Q, 
można założyć najbardziej niekorzystny wariant 
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tego działania, a mianowicie, że układ <2, jako stroną 
gry, dąży do minimalizacji wartości współczynnika M : 
W świetle takiego zwożenia, uwarunkowanego anta- 
gonistycznym. cłrarakterem gry, system, cyfrowy jako 
strona II gry budzie .dążył do maksymalizowania 
wartości współczynnika k. ; 

W - grze wielochodowej każda ze strop gry dyspo¬ 
nuje zbiorem przyporządkowanych jej strategii cho¬ 
dowych. Dla strony / gry zbiorem strategii chodo¬ 
wych jest zbiór Z, który z punktu widzenia teorii 
gier można nazwać zbiorem pseudodecyzji układu Q. 
Natomiast dla strony II gry zbiorem strategii cho¬ 
dowych jest zbiór Y, zawierający możliwe decyzje 
etapowe do kierowania układem Q. Graficzną po¬ 
stacią gry wielochodowej jest dendryt gry, który 
w rozpatrywanym przypadku jest jednocześnie 
graficznym obrazem wieloetapowego procesu de¬ 
cyzyjnego. Otrzymanie dendrytu gry związane jest 
z koniecznością zastosowania i realizacji algorytmu 
syntezy dendrytu na podstawie danych o zbiorach 
Z i Y, znajomości relacji między elementami tych 
zbiorów oraz zadanego kryterium efektywności. 
Na ryc. 47, przedstawiającej m.in. uproszczony graf 
matematycznego modelu wypracowania optymalnych 
decyzji etapowych, dendryt gry wielochodowej jest 
opisany funkcją *F(Z, Y, t). Dendryt ^(Z, Y, t) 
nie jest jeszcze algorytmem wypracowania przez 
system cyfrowy optymalnych decyzji etapowych do 
kierowania układem Q. Dlatego też, aby uzyskać 
możliwość wypracowania tych decyzji przez system 
cyfrowy, należy przeprowadzić jednostronną opty¬ 
malizację dendrytu gry. Jednostronną optymali¬ 
zację dendrytu gry przeprowadza się na korzyść 
jednej ze stron gry, a w interesującym nas przypadku 
na korzyść strony II gry, tj. systemu cyfrowego. 

Jak wiadomo, cechą charakterystyczną jedno- 
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strórińie zoptymalizowanego dendrytu jest to, że 
przedstawia on taki rodzaj gry, w której jeden z gra¬ 
czy ma ż góry narzucone optymalne strategie swego 
stępowania. Stąd też, przy realizacji gry według 
jednostronnie zoptymalizowanego dendrytu, system 
cyfrowy jako II strona gry nie dokonuje % dowolnej 
sytuacji wyboru strategii chodowej w zbiorze moż¬ 
liwych strategii chodowych przyporządkowanych tej 
sytuacji, gdyż dysponuje tylko jedną, optymalną dla 
tej sytuacji Strategią chodową. Przekształcenie deh- 
drytń *F(Z, Y, t) ha dendryt jednostronnie zopty¬ 
malizowany, opisany funkcją ®(Z, Y, t), realizuje 
się Według ściśle określonego algorytmu. ‘ Gelem 
otrzymania jak najbardziej Zwięzłego módelu mate¬ 
matycznego wypracowania optymalnych decyzji 
etapowych, jednostronnie zoptymalizowany dendryt 
gry podlega minimalizacji. 

Minimalizacja ta sprowadza się do zmniejszenia 
rozmiarów dendrytu przez wzajemne pokrycie się 
izomorficznych względem siebie części składowych 
jednostronnie zoptymalizowanego dendrytu gry. 
Zminimalizowany dendryt gry, oznaczony na ryc. 47 
funkcją F(Z, Y, t), opisuje jednoznacznie strukturę 
automatu rozgrywającego, który wypracowuje opty¬ 
malną decyzję dla sterowania układem Q na pod¬ 
stawie aktualnej informacji o stanie układu w danej 
chwili t. Tego typu automat może zostać zmodelo- 
wany za pomocą programu na maszynie cyfrowej 
o strukturze uniwersalnej lub też może wystąpić 
w systemie cyfrowym jako maszyna cyfrowa wy¬ 
specjalizowana. 

Wypracowana przez automat rozgrywający F(Z, 
Y, t) optymalna decyzja etapowa do kierowania 
układem Q podlega analizie, której wynikiem są 
optymalne decyzje etapowe dla poszczególnych 
obiektów X t e Q. Scharakteryzowany wyżej model 
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abstrakcyjny systemu przetwarzającego informację 
jest pewną wizją właściwego wykorzystania maszyn 
cyfrowych w złożonych, wieloetapowych procesach 
kierowania. Model ten jednoznacznie określa funk¬ 
cjonowanie systemu cyfrowego w wieloetapowym 
procesie decyzyjnym, jak również rzutuje na archi¬ 
tekturę tegoż systemu. Dokładne określenie konfi¬ 
guracji elementów systemu cyfrowego zależy od 
znajomości struktury układu Q oraz od przypo¬ 
rządkowania elementom abstrakcyjnym, występu¬ 
jącym w przedstawionym systemie przetwarzającym, 
odpowiednich wielkości rzeczywistych. 

Należy sądzić, że w perspektywie rozwoju cyber¬ 
netyki tego typu systemy będą odgrywać rolę domi¬ 
nującą. 



Zakończenie 


Niniejsza książka nie obejmuje wszystkich 
problemów z zakresu cybernetyki, dających się 
opisać modelem matematycznym dwuosobowej gry 
wielochodowej. Przydatność aparatu formalnego gier 
wielochodowyeh do opisu tych problemów została 
zilustrowana tylko na trzech przykładach, mających 
niewątpliwie duże znaczenie praktyczne. 

Mianowicie, w aspekcie dwuosobowej gry Wielo¬ 
chodowej rozpatrzono problem samosterowalności 
obiektu w przestrzeni, problem diagnostyki systemu 
oraz zagadnienie wypracowania optymalnych de¬ 
cyzji przez system cyfrowy kierujący układem z za¬ 
chowaniem celowym. 

Dwa ostatnie problemy w zasadzie zostały tylko 
zasygnalizowane, z jednej strony ze względu na 
ograniczoną objętość książki, a z drugiej w celu 
uniknięcia nadmiernego przeładowania matema¬ 
tyką jej treści. Z wielu przemilczanych w książce 
problemów, dających się sprowadzić do postaci 
formalnej gry wielochodowej, na szczególną uwagę 
zasługuje modelowanie procesów śledczych w sądo¬ 
wnictwie oraz budowa modeli cybernetycznych 
wchodzących w zakres ekologii i bioniki. Naj¬ 
bardziej jednak użyteczne i najogólniejsze zastoso- 

245 


V 


wanie aparati formalrego gier wielochodowych 
wiąże się z opisem wieloetapowych procesów de¬ 
cyzyjnych, zachodzących w systemach z zachowa¬ 
niem celowym. Wykorzystanie aparatu formalnego 
gier wielochodowych do opisu procesów decyzyj¬ 
nych występujących w procesie kierowania złożo¬ 
nymi układami ekonomicznymi, a nawet* pewnymi 
gałęziami gospodarki narodowej, podwyższy w du¬ 
żym stopniu optymalność podejmowanych decyzji. 
Oczywiście kierowanie takie łączy się z wykorzy¬ 
staniem komputerów. 

Aby jednak najracjonalniej wykorzystać kompu¬ 
tery-: w systemie automatycznego .kierowania lub za¬ 
rządzania,: należy' -znać algorytm działania •••tego 
systemu^: Algorytm. taki. można opracować korzy¬ 
stając-z; aparatu formalnego gier wielochodowych 
(por. rozdział 9). Stąd jak najbardziej jest uzasadniona 
kontynuacja badań maukowych w kierunku prak¬ 
tycznego wykorzystania- aparatu: formalnego- gier 
wielochodowych . do. opisu -•wieloetapowych proce¬ 
sów ‘decyzyjnych. ■; ■:..y . -: ■•?■. ■: . ....- ;, 
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Nakładem Wydawnictwa Wiedza Powszechna 
ukazały się 


MAŁY SŁOWNIK CYBERNETYCZNY 

PRACA ZBIOROWA POD RED. M. KEMPISTY 

Pierwszy polski słownik podstawowych pojęć i terminów 
z zakresu cybernetyki i nauk pokrewnych, np. matematyki, 
logiki, psychologii itp. Słownik zawiera także dane biograficzne 
dotyczące wybitnych badaczy polskich i zagranicznych. Liczne 
ilustracje ułatwiają zrozumienie pojęć cybernetycznych. Słownik 
może być przydatny zarówno dla specjalistów, jak i dla wszy¬ 
stkich interesujących się cybernetyką. 


CO TO JEST CYBERNETYKA 

GEORG KLAUS, HEINZ LIEBSCHER 

Cybernetyka zdobyła w świecie ustaloną pozycję, jej zna¬ 
czenie stale rośnie, a mimo to znajduje się w początkowym 
okresie swego rozwoju. 

W książce autorzy — Georg Klaus, wybitny filozof i cyber¬ 
netyk niemiecki i jego bliski współpracownik Heinz Liebscher, 
starali się zapoznać czytelnika z podstawowymi pojęciami 
cybernetyki ukazując jej metody badawcze i obiekty, na któ¬ 
rych cybernetycy przeprowadzają doświadczenia. Duże partie 
materiału poświęcone są zagadnieniom modelowania cyber¬ 
netycznego, uczenia się, automatyzacji i planowania. 

Autorzy nie poprzestali. tylko na rozważaniach teoretycz¬ 
nych, ale przedstawili też możliwości praktycznego zastoso¬ 
wania niektórych osiągnięć cybernetyki — przede wszystkim 
w zakresie planowania gospodarczego. 
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„OMEGA” 1973 


Ukazały się: 

238. A. S. Kompaniejec Prawa fizyki statycznej 

239. C. Podgórski Lenino 

240. T. Kielanowski Rozmyślania o przemijaniu 

241. H. Chołaj Budowa socjalizmu na wsi a polityka 
rolna 

242. E. Ciupak Katolicyzm ludowy w Polsce 

243. L. Stolarczyk, U. Stolarczyk Wolne rodniki 

244. J. Goryński Mieszkanie wczoraj, dziś i jutro 

245. Z. Wieczorek Neopsychoanaliza i marksizm 

246. W. Sedłak U źródeł nowej nauki. Paleobiochemia 

247. M. Czerwiński Magia, mit i fikcja 

248. K. Kuratowski Pół wieku matematyki polskiej 
1920—1970 

249. J. Tazbir Rzeczpospolita szlachecka wobec wiel¬ 
kich odkryć 

250. A. Urbanek Rewolucja naukowa w biologii 
223. B. Suchodolski Komisja Edukacji Narodowej. 

Wyd. II 


W przygotowaniu: 

W. W. Sawyer W poszukiwaniu modelu matematycz¬ 
nego 

A. Wyczański Polska w Europie XVI stulecia 
E. Leach Levi-Strauss 





